江苏省研究生培养创新工程项目(20120515)
- 作品数:3 被引量:23H指数:2
- 相关作者:杨长春周猛徐小松叶施仁封红旗更多>>
- 相关机构:常州大学更多>>
- 发文基金:江苏省研究生培养创新工程项目国家自然科学基金江苏省科技厅基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于改进完全子图模型的关注对象多社区发现研究
- 2016年
- 为实现用户和关注对象的多社区划分,针对完全子图模型不能进行多类分类的缺陷,该文引入了阈值划分方法,提出基于改进完全子图模型的社区发现算法。实验表明:与经典数据挖掘算法K-medoids相比,该文算法具有更高的准确性。
- 封红旗雷晨阳沈田予杨长春
- 关键词:数据挖掘算法
- 基于文本相似度的微博网络水军发现算法被引量:11
- 2014年
- 微博中水军发表的评论内容具有重复或者相似性,提出了基于文本相似度的微博网络水军发现算法.评论内容可以用特征码来表示.特征码再通过高效的B-Tree来索引,使整个系统具有极高的处理效率.根据水军发帖的重复性或者相似性很高的特点,通过对多个相同或相似的评论内容进行统计分析找出出现次数频繁的用户,初步定义为水军.再对这些用户的评论内容进行分析,发现他们的评论内容基本上都是具有重复性.试验表明,该方法能够准确、有效地找出水军账户.
- 杨长春徐小松叶施仁周猛
- 关键词:特征码索引文本相似度
- 基于改进CURE算法的微博热点话题发现被引量:12
- 2013年
- 由于微博平台的信息量大,为对博文热点进行准确识别,本文提出了一种基于经典CURE聚类算法的改进算法来发现微博热点话题。本文选取了20391条中文微博作为样本数据集,通过将博文稀疏矩阵化达到将高维数据降维的效果,很大程度上提高了计算的精度和速度。从选取CURE层次聚类的代表点出发,将代表点转换为博文种子集,同时调节收缩因子,加大排除博文的异常点,利用CURE层次聚类算法的思想设计了改进的CURE算法来发现微博热点话题,通过实验发现改进CURE层次聚类算法能够将数据集中的74.65%作为孤立点,更好的提高了算法的精度,同时准确地抓住长尾效应的"头部",能够更加直观的发现微博热点话题。
- 杨长春周猛叶施仁徐小松
- 关键词:层次聚类算法