赵美玲
- 作品数:4 被引量:6H指数:2
- 供职机构:新疆大学信息科学与工程学院更多>>
- 发文基金:新疆维吾尔自治区自然科学基金国家自然科学基金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于最大公共子图的本体映射方法研究
- 2017年
- 本体映射是对两个本体中的各元素建立语义关系,而影响本体映射的关键是相似度的计算方法。针对相似度计算方法中仍存在语义关系不精准的问题,提出一种本体映射方法,把本体映射问题转化为求解最大公共子图的问题。以图结构表示的本体可更好地体现本体结构之间潜在的语义关系,应用最大公共子图提取本体中的公共部分,并用最大公共子图的性质计算2个本体中元素之间的相似度,进而得到2个本体之间的映射关系。实验结果表明,与Ctx Match,COMA相比,该方法在召回率和准确率方面都有一定提高。
- 郭竹为刘胜全刘艳赵美玲符贤哲
- 关键词:语义关系相似度本体映射图结构
- 基于动态主题模型的舆情本体概念抽取被引量:3
- 2018年
- 对现有领域本体学习方法不能直接移植在舆情本体学习方法上的问题进行研究,根据舆情本体的动态主题性提出一种基于动态主题模型的舆情本体概念抽取的方法。结合舆情周期内词语的前驱增速和后继增速提取主题特征词,主题度选取主题词;对主题词通过主题相关度进行聚类,形成主题词簇;对主题词簇下候选概念进行主题概念隶属度的过滤得到舆情本体概念;以上述概念作为种子词寻找左右邻接词得到复合词,过滤得到舆情本体复合概念。实验结果验证了该方法具有更高的准确率和召回率。
- 赵美玲刘胜全刘艳郭竹为符贤哲
- 关键词:主题相关度
- 基于改进K-means聚类与图模型相结合的多文本自动文摘研究被引量:2
- 2017年
- 目前多文档文摘大多数对同一主题下的文本进行摘要,不同主题下的文本自动文摘的研究相对较少。已有的多文本自动摘要或多或少有不足,使用聚类方法存在初始质心k无法确定以及构造图模型时句子相似度计算没有考虑语义特征等现象。对不同主题的多文档进行主题划分,然后依据主题进行多文本自动摘要,针对以上多文档文摘方法存在的不足,改进K-means聚类、句子相似度计算等缺陷,提出改进K-means聚类和图模型相结合的方法。通过实验表明,该方法的准确率高于基于聚类或者基于图排序的算法。
- 赵美玲刘胜全刘艳郭竹为符贤哲
- 关键词:自动文摘聚类图模型
- 基于生存法则的稳定新词识别方法的研究被引量:1
- 2018年
- 针对新词识别过程中出现大量噪声词和伪新词的问题,提出一种基于生存法则模型的稳定新词识别方法.该方法借鉴自然法则和遗忘定律,分析候选词串在时序分布中的词频变化,通过词串在语言环境中表现的综合竞争力淘汰突发性特征的噪声词以及词义不稳定的伪新词,识别网络短文本中出现的稳定新词.该方法可以保证网络新词的新颖性和稳定性,可为舆情本体新概念的抽取提供基础支持,有助于提高舆情本体概念抽取的准确率和查全率.
- 符贤哲刘胜全刘胜全刘艳赵美玲
- 关键词:新词识别