吉林省自然科学基金(20070533)
- 作品数:2 被引量:24H指数:2
- 相关作者:左万利朱会峰赫枫龄彭涛梁浩更多>>
- 相关机构:吉林大学更多>>
- 发文基金:国家教育部博士点基金吉林省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于本体的文本聚类方法被引量:13
- 2010年
- 基于本体的文本聚类方法,在文本表示上引入WordNet,并定义了关键概念集,使用WordNet中的概念节点及概念间的语义关系减少文本特征向量维数,提高聚类效果.聚类过程中,算法使用文本的关键概念集和概念特征向量计算文本相似度,利用文本的关键概念集标注聚簇为聚类结果中的各个簇提供解释.实验结果表明,该方法有效地减少了文本特征向量的维数,提高了文本聚类效果以及聚类结果的可解释性.
- 朱会峰左万利赫枫龄彭涛纪文彦
- 关键词:本体WORDNET
- 基于多个领域本体的文本层次被定义聚类方法被引量:12
- 2010年
- 传统的聚类方法常常将文本中关键词的相似度作为聚类的依据,丢失了很多重要的语义信息,导致聚类结果不够准确且计算量大。提出了一种基于多个领域本体的文本层次聚类方法,利用多个领域本体将用关键词表示的文本特征向量表示为与之匹配的概念向量集,定义文本相似度的计算公式,设计并实现基于多个领域本体的文本凝聚聚类算法。实验结果表明,该方法从概念层次上表示和处理文本,降低了聚类对象空间的维度,减少了计算量,提高了文本聚类的精确度和聚类效率。
- 张爱琦左万利王英梁浩
- 关键词:领域本体相似度计算凝聚层次聚类