肖雪
- 作品数:3 被引量:21H指数:3
- 供职机构:中国科学院文献情报中心成都分馆更多>>
- 发文基金:中国科学院西部之光基金国家高技术研究发展计划更多>>
- 相关领域:文化科学更多>>
- 引文网络的社团划分研究进展综述被引量:11
- 2016年
- [目的/意义]引文网络的社团划分对于分析学科知识结构及发展脉络,揭示学科发展趋势具有重大意义。为了解引文网络的社团划分研究现状,以期刊文献为研究对象,利用统计分析、信息计量等方法,揭示该领域知识发展脉络和演进轨迹。[方法/过程]借助Citespace II、TDA等工具,通过对该领域知识研究进展、关键词分布、主题与功能分析以及对重要文献的解读与归纳,对引文网络的社团划分的研究进展进行综述性研究。[结果/结论]研究发现,当前引文网络的社团划分相关研究主要集中于社团划分方法研究、学科结构特征研究以及引文网络的社团划分应用研究三个方面。当前基于引文网络的社团划分方法仍不够完善,时间复杂度和准确性仍是大规模引文网络社团结构分析算法面临的两个重要问题。
- 肖雪陈云伟邓勇
- 关键词:引文网络社团划分聚类分析数据挖掘
- 基于节点内容及拓扑结构的引文网络社团划分被引量:6
- 2017年
- 引文网络的社团划分是文本挖掘的一种重要方法,为提高引文网络社团划分的准确性,本文提出一种综合考虑引文网络的内容和拓扑结构属性的社团划分方法。该算法首先利用改进的余弦相似度方法计算节点相似度,然后综合考虑节点结构与内容相似度对网络进行重构,在此基础上以相邻节点对相似度作为边权,运用Louvain社团划分方法对加权引文网络进行社团划分,提出一种综合考虑节点内容及结构属性的社团划分方法。通过在真实引文网络数据集上的实验表明,本文所提出的方法能改善引文网络的划分效果。
- 肖雪陈云伟邓勇
- 关键词:引文网络社团划分聚类文本挖掘文本相似度
- 基于样本加权的引文网络的社团划分被引量:5
- 2016年
- [目的 /意义]为提高引文网络的社团划分的准确性,提出一种基于加权的引文网络的社团划分方法。[方法/过程]以Louvain社团划分方法为算法基础,将科学论文用向量空间模型表示,利用改进的余弦相似度方法计算相邻论文之间的相似度,并将其作为权重,综合考虑论文内容属性与结构属性,提出一种基于样本加权的引文网络社团划分方法。[结果 /结论]该算法将引文网络中论文的文本内容属性与拓扑结构属性结合起来,通过对Scientometrics期刊发表的论文以及主题为CRISPR的论文进行社团划分研究实验,结果表明该方法能改善引文网络社团的划分效果。
- 肖雪王钊伟陈云伟邓勇
- 关键词:引文网络社团划分聚类文本挖掘