周环宇
- 作品数:4 被引量:5H指数:2
- 供职机构:内蒙古科技大学信息工程学院更多>>
- 发文基金:教育部“春晖计划”更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于JS综合相似度的个人微博时序事件归类研究被引量:2
- 2015年
- 为了提高个人微博相似度的精确性,实现事件的高效归类,提出一种基于改进的Jaccard相似度和余弦相似度的JS综合相似度算法。该算法采用改进的TF-IDF算法提取特征词及LDA(Latent Dirichlet Allocation)主题模型构造同类词模板,在此基础上计算个人微博相似度,最后利用K-means时序事件归类算法对个人微博进行归类。实验结果表明所提出的JS综合相似度算法比传统的相似度算法具有更高的精确度,在一定程度上提高了个人微博时序事件归类的准确性。
- 高永兵聂知秘周环宇钟振华
- 关键词:相似度特征词
- 基于K-means的私人微博聚类算法改进被引量:2
- 2014年
- 针对私人微博内容进行聚类研究,结合私人微博的内容和结构特点提出了基于K-means的改进聚类算法。通过添加引用和评论内容丰富了文本内容,降低了短文本矩阵向量严重稀疏性带来的聚类算法准确性降低的影响;通过甄别"微话题"内容和改进相似度的计算,找到初始化类别并进行初步计算得到合适的类别数目和初始中心点,解决了K-means算法中聚类数目K需人工指定和初始中心点选取随机性的问题。实验结果表明,改进后的算法不仅可以自适应地得到K值,较普通的K-means算法在聚类的准确率上有所提高。
- 高永兵郭文彦周环宇聂知秘
- 关键词:K-MEANS自适应
- PWSWE:个人微博主题词提取算法的研究被引量:1
- 2015年
- 在分析传统短文本主题词提取算法的基础上,综合考虑个人微博的非主流文本特征,提出一种个人微博主题词提取算法PWSWE(Personal weibo subject word extraction algorithm)。该算法采用增量式的提取模式,首先引进由微博转帖、评论和赞数组成的流行度概念;其次对耦合、时序和流行度进行串行相似度计算;再次针对关键词特征值离散现象,对传统TF-IDF函数进行改进;最后综合以上提取结果并进行相应地处理得到最终的主题词。实验结果证明该算法提取的主题词具有较高的准确率和覆盖率。
- 高永兵周环宇聂知秘胡文江
- 个人微博中公共事件检测算法的研究
- 伴随着计算机应用技术的迅猛发展,互联网传媒也相应地的兴起并快速地影响着人们的日常生活,与此同时成为了电视、报纸和广播等多种传统媒体之后的又一个新闻载体。由于信息能够在互联网空间内实现快速传播,其信息本身也呈现出了多元化、...
- 周环宇
- 关键词:模版匹配
- 文献传递