关煜
- 作品数:2 被引量:1H指数:1
- 供职机构:东北师范大学地理科学学院更多>>
- 发文基金:国家教育部博士点基金吉林省科技发展计划基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于本体的食品投诉文档文本聚类研究
- 随着互联网时代的到来,信息在传播途径上发生了翻天覆地的变化,人们可以轻易的从网络上下载海量数据,文本聚类作为一种有效的文本组织手段,可以帮助人们发现网路上热点的问题,自动编辑多文档文摘,文本聚类受到了越来越多学者的关注。...
- 关煜
- 关键词:文本聚类信息传播
- 一种新的本体的概念语义相似度计算方法被引量:1
- 2015年
- 提出了一种新的语义相似度计算方法。该算法结合了被评估概念的高度、路径长度和公共细化度(specificity);改进了基于路径的语义相似度算法,利用本体结构,引入基于信息量算法的思想,使得新算法能够获取更多的语义信息,同时又不需要对于文本数据进行预处理;考虑本体中簇的粒度对本体的相似度计算有一定影响,在公式中添加概念在本体中的高度信息,达到低层次的概念间共享的信息要比高层次的概念间共享的信息更多。为了评估所提出的新方法,在实验中,用标准的生物医学系统命名法-临床术语(systematized nomenclature of medicine-clinical terms,SNOMED CT)作为输入本体,用已标注好的概念对集合作为数据集。实验结果表明,所提出的方法不仅保留了基于路径算法的简洁性,还优于现有语义相似度算法,证明了所提出方法的有效性。
- 孙铁利邢元元关煜陈斯娅杨凤芹孙红光
- 关键词:语义相似度