兰州市科技发展计划项目(2008-1-28)
- 作品数:4 被引量:42H指数:4
- 相关作者:闫光辉李祥舒昕陈勇赵红运更多>>
- 相关机构:兰州交通大学西北工业大学更多>>
- 发文基金:兰州市科技发展计划项目国家自然科学基金陇原青年创新人才扶持计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于主题和链接分析的微博社区发现算法被引量:28
- 2013年
- 针对传统社区发现方法大多基于链接或主题关系,且没有考虑获取微博用户社会信息时的限制,无法有效识别微博中多个社区的问题,提出了一种综合基于主题和链接分析的微博社区发现算法来挖掘微博中多个社区。算法首先研究微博用户的链接及博文主题特性,定义了链接相关度和主题相关度公式;然后推出用户总相关度公式,以此来计算节点间的传递概率,用改进后的标签传递算法对用户分类;最终划分出兴趣相似且社会联系紧密的用户群。真实数据集上的仿真实验验证了该方法的合理性和有效性。
- 闫光辉舒昕马志程李祥
- 关键词:主题模型链接分析
- 两阶段无监督顺序前向分形属性规约算法被引量:4
- 2008年
- 采用单个属性多重分形维数及属性合并之后分形维数变化程度作为属性相关性的度量依据,以结果属性子集分形维数与属性全集分形维数的差值作为评价结果属性子集优劣的标准,将分形属性规约问题转化为属性个数受限的最大无关分形属性子集搜索问题.针对高维属性空间搜索的"组合爆炸"现象,设计了结合相关性分析与冗余性分析的两阶段顺序前向无监督分形属性规约算法.初步分析了算法的时空复杂性,基于标准与合成数据集的实验结果表明,算法能够以较低的分形维数计算工作量得到较优的属性子集.
- 闫光辉李战怀
- 关键词:数据挖掘维数灾难分形维数
- 基于时间特性的微博热门话题检测算法研究被引量:6
- 2014年
- 以用户兴趣理论和用户之间的关注行为为基础,结合时间因素在微博热门话题检测中的重要作用,研究了如何有效获取微博中最新、最有价值的话题问题,基于PageRank经典算法提出了一种带时间参数的热门话题检测算法(TimePageRank)。算法首先使用投票机制抽取出用户感兴趣的话题并记录话题的生成时间;然后用权值计算公式计算每个话题的权值;最后使用TimePageRank算法对这些话题进行排名,从而检测出微博中的热门话题。真实数据集上的实验结果验证了该方法的高效性。
- 闫光辉赵红运任亚缙陈勇
- 关键词:用户兴趣PAGERANK算法
- 基于链接的微博用户可信度研究被引量:4
- 2015年
- 以新浪微博为研究对象,基于PageRank算法思想,参考网络群体结构平衡理论并且结合微博用户固有属性等因素,提出一种评估微博用户可信度的模型UC及相应的算法,以解决微博用户可信度比较问题。UC模型由用户自评估和用户互评估两个子模型构成,首先根据每个微博用户的固有属性使用自评估模型计算出每个用户的初始可信度值,然后将用户的初始可信度值作为用户互评估模型的输入计算出每个用户互评估可信度得分,从而对用户的可信度进行比较排序。真实数据集上的实验结果验证了该方法的有效性。
- 闫光辉刘晓飞王梦阳
- 关键词:PAGERANK算法