搜索到964篇“ 词汇相似度“的相关文章
基于近邻聚类的词汇相似测量研究
2024年
本研究以一组近义词difference与distinction为例,使用近邻聚类法,以两词的“行为特征”作为聚类标准,探究1990—2019年间两词各自词汇相似的历时演变与两词词汇相似比较的历时演变,并对历时变化的原因做出阐释。研究发现,difference词汇相似演变经历三个阶段,distinction的词汇相似演变经历四个阶段,两词的词汇相似演变经历三个阶段,各年代间两词的“行为特征”不断相互影响,相互渗透,呈现个性与共性的统一。研究结果可历时、动态地探究各类词汇的语义关联性和时间差异性,有助于还原该词义产生、扩展和嬗变的动因,同时也为近义词辨析、词汇相似计算等相关研究开辟新视角。
汤慧桃王军
关键词:词汇相似度
一种基于图像识别和字形词汇相似的船名识别方法
本发明涉及一种基于图像识别和字形词汇相似的船名识别方法,所述方法包括以下步骤:步骤1:对船舶图片进行基于人工智能的光学字符识别,步骤2:判断识别文字为船舶名称的可能性;步骤3:考虑换行、倒序、文字相隔过远、中文夹杂拼音...
沈照君
基于词嵌入和WordNet的词汇相似计算模型
随着计算机理论和技术的飞速发展,自然语言处理在日常生活以及学术研究中都变得越来越重要,计算词汇相似就是其中的一个重要方面。词汇相似计算的目标是对一对词或概念在语义上的相似进行量化。词汇相似可以应用到很多重要的领...
赵福强
关键词:语义信息
基于深学习和词汇相似的个性化新闻推荐系统设计被引量:2
2021年
对网络上庞大的新闻资讯,如何发展一个个性化的新闻推荐系统,自动地推荐使用者感兴趣的新闻,是一个备受重视的课题。文章提出一个个性化新闻推荐系统,此系统将建立一个新闻本体,并通过深学习计算使用者偏好,以此达到推荐个性化新闻的目的。此新闻本体以分析新闻的词汇为基础,并参考专家的分类。其中,每个类别包含特定数量的代表性词汇,而这些词汇以时事新闻进行TF-IDF统计而得。对每一则新闻,系统将计算该则新闻所包含的词汇与新闻本体中代表性词汇相似,定义为新闻的特征向量,并将此特征向量输入多层次类神经网络进行深学习计算得出新闻推荐值。实验结果显示,相较于随机推荐,文章所提出的方法可以较大地提升推荐成功的比率,神经网络将由推荐值来判断是否推荐给使用者,若是使用者未点击阅读此新闻,判断为使用者不喜欢此篇新闻,神经网络将会进行修正,使之越来越接近真实的使用者偏好。
江涛
关键词:TF-IDF
基于形式概念分析的词汇相似计算
2020年
【目的】在文献层和词汇层之间加入主题层,研究一种新的词汇相似计算方法。【方法】阐述基于形式概念分析(FCA)的主题定义和表示模型,将词汇项映射到主题层级,提出一种基于主题相似定量刻画词汇相似的计算方法。【结果】以信息检索领域为例,以SIGIR会议2006-2016年收录的论文数据为样本进行评测,结果表明本文方法的精确率与召回率比FastText方法有显著提高,最大提升幅分别达到30%和21%。【局限】该方法依赖文献关键特征词抽取的质量。【结论】基于形式概念分析的词汇相似计算方法有效利用了词汇对应的主题语义关系,能更好地反映词语之间的关联性。
刘萍彭小芳
关键词:词汇相似度形式概念分析概念格主题
基于百百科多特征信息的词汇相似计算被引量:1
2020年
作为自然语言理解的一项基础工作,词汇语义相似量一直是研究的重点。语义相似量本身是一个中间任务,它是大多数自然语言处理任务中一个必不可少的中间层次,在自然语言处理中有着广泛的应用,如词义消歧、信息检索以及机器翻译等。论文提出了一种新的基于百百科词条信息的词汇相似计算方法。该方法经由百科名片、词条正文,开放分类和相关词条四个部分的内容,分别计算出它们之间的相似性值,以此来获得一对词汇间的整体相似性。经试验证明,在Words-240数据集上,论文方法在词汇相似计算上,准确率更高。
仲远王芳黄树成
关键词:自然语言处理词汇相似度
确定汉语词汇相似的方法和装置
发明人提供了一种确定汉语词汇相似的方法,包括如下步骤:给定待确定相似的第一词汇和第二词汇,所述第一词汇含有M1个汉字,所述第二词汇含有M2个汉字;将第一词汇中的各个汉字分别与第二词汇中的各个汉字配对,形成P个待判单字...
徐戈晁阳关胤吴拥民刘德建
文献传递
词汇相似计算和相似词挖掘研究进展被引量:7
2016年
作为语言的三大构成要素之一,词汇在人类的思维活动和思想交流中发挥着无可替代的作用。相似词是自然语言中一个普遍存在的现象,相似计算是其它多个研究的中间步骤。本文阐述了相似的概念以及相似词挖掘的相关理论基础;基于所使用的资源,将词汇相似研究划分为基于语义词典、基于语料库和基于百科文档链接的方法,并分别进行了述评;介绍了词汇相似的评价方法以及词汇相似研究的未来趋势。
韩普王东波王子敏
关键词:相似词相似度计算
基于词汇相似的医学分类体系映射研究与实现被引量:2
2016年
采用编辑距离法计算《学科分类与代码》(医学类目)与《医学专业分类表》分类体系类目词汇相似,通过计算机辅助映射结合人工判断类目间的映射关系,建立《学科分类与代码》(医学类目)与《医学专业分类表》类目之间的映射关系表,以期满足不同类型、不同层次的用户需求。
单连慧赵迎光钱庆
关键词:知识组织系统词汇相似度
确定汉语词汇相似的方法和装置
发明人提供了一种确定汉语词汇相似的方法,包括如下步骤:给定待确定相似的第一词汇和第二词汇,所述第一词汇含有M1个汉字,所述第二词汇含有M2个汉字;将第一词汇中的各个汉字分别与第二词汇中的各个汉字配对,形成P个待判单字...
徐戈晁阳关胤吴拥民刘德建
文献传递

相关作者

陶县俊
作品数:7被引量:19H指数:2
供职机构:河南师范大学计算机与信息技术学院
研究主题:ONTOLOGY 词汇相似度 文本倾向性分析 《知网》 本体
刘倩
作品数:4被引量:19H指数:2
供职机构:河南师范大学计算机与信息技术学院
研究主题:词汇相似度 文本倾向性分析 ONTOLOGY 《知网》 舆情
钱龙华
作品数:83被引量:209H指数:9
供职机构:苏州大学
研究主题:文本 语料库 关系抽取 抽取 树核函数
粟春兵
作品数:3被引量:5H指数:1
供职机构:杭州师范大学
研究主题:词汇相似度 粤语 相似度 差比句 辨析
王晓东
作品数:85被引量:434H指数:11
供职机构:华东师范大学
研究主题:ONTOLOGY 本体 语义WEB WEB 知识库