河南省教育厅自然科学基金(2008B520046)
- 作品数:8 被引量:45H指数:3
- 相关作者:程传鹏夏敏捷胡恩良吴志刚齐晖更多>>
- 相关机构:中原工学院云南师范大学更多>>
- 发文基金:河南省教育厅自然科学基金云南省科技计划项目河南省政府决策研究招标课题更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于位置信息的未登录词的识别方法被引量:1
- 2008年
- 根据汉字的内码,在内存中以汉字内码的升序建立词典,通过分词碎片的位置信息来识别未登录词,避免了字符串的直接匹配,减少了算法的时间复杂度.
- 程传鹏
- 关键词:自动分词未登录词内码散列
- 微博自动标引关键技术的研究被引量:5
- 2011年
- 针对微博文本的特点,提出了一种自动识别微博标引词的方法。根据微博文本中的名词或动词之间语义相似度构造图的邻接矩阵,在图的邻接矩阵基础上利用Pagerank算法思想来计算词语的重要度,选择重要度较大的一些词作为标引词。实验结果表明,较传统的自动标引方法,提出的自动标引方法简单实用、准确率较高。
- 程传鹏夏敏捷
- 关键词:自动标引邻接矩阵PAGERANK算法重要度
- 一种面向领域的微博用户权威排名方法被引量:1
- 2014年
- 通过权威度较高的用户所发的微博,可以更快捷的获得感兴趣的信息.目前微博用户权威度排名对用户所发微博的领域性和专业性缺乏考虑.本文针对微博的特点,提出了一种计算微博用户在某个领域权威度的方法,分析了微博用户的领域集中度、微博用户之间的兴趣相似度、关注度对领域权威度的影响,给出了三个影响因素的相应计算方法.依据用户之间的"关注"和"被关注"的关系,参考了PageRank公式的含义,提出了一种微博用户领域权威度的计算方法.实验结果表明,通过该方法所获得的用户排名较其他的方法更为合理.
- 程传鹏夏敏捷胡恩良甘健侯
- 关键词:兴趣相似度关注度
- 一种基于知网的句子相似度计算方法被引量:27
- 2012年
- 句子相似度是衡量文档相似度的基础,在自然语言处理领域中有着非常重要的作用。目前的句子相似度计算方法忽略了句子的结构对相似度的影响。本文在分析已有研究工作的基础上,提出了一种改进的句子相似度计算方法。依据知网对"实体概念"的描述,构造出义原的语义层次树,由各个义原在树中的相对位置,计算出义原之间的相似度。对三种义原加权求和得到词语之间的语义相似度。综合句子的表层相似度和句子的词语语义以及词语的相对位置关系,得到句子的整体相似度。实验表明,在同等的测试条件下,本文所提出的句子相似度计算方法在相似度比较上更符合人的直观感觉。
- 程传鹏吴志刚
- 关键词:句子相似度知网
- 基于用户评价的自动评分方法被引量:1
- 2014年
- 提出了一种基于用户评价内容的自动评分方法;分析了常见词语相似度计算方法在情感倾向判断中的不足,并提出了相应的解决方法;分析了情感修饰词对情感倾向的影响,利用社会网络分析中的仿真软件UNICET选择出基准词。实验表明,该自动评分方法与用户实际的评分非常接近,具有一定的合理性。
- 程传鹏吴婷胡恩良
- 关键词:用户评价自动评分情感倾向语义相似度修饰词
- 自动文摘中的冗余句消除方法被引量:2
- 2011年
- 针对自动文摘的信息冗余问题,提出了一种冗余语句消除的方法。利用《同义词词林》来定义词语语义距离计算公式,根据词语的相似度,建立主题词和主题句之间的一一对应关系,借用编码理论中海明距离的理论,得到了文摘中主题句的相似度,设置阈值过滤掉相似度较高的主题句,从而实现了主题句的约简。实验结果证明,该方法提高了文摘的精度。
- 程传鹏杨要科
- 关键词:自动文摘语义距离海明距离
- 文本相似度计算在主观题评分中的应用被引量:6
- 2012年
- 针对传统主观题自动评分准确度低的问题,提出一种基于文本相似度计算的主观题评分方法。利用扩展的《同义词词林》计算词语之间的相似度,根据标准答案中的词语和学生答卷中的词语以及词语之间的相似度构造二部图,通过二部图的最大匹配算法获得标准答案和学生答案的相似度。实验结果表明,该方法可以给主观题评分提供一个较好的参考。
- 程传鹏齐晖
- 关键词:自动评分文本相似度二部图
- 网络评价倾向性研究被引量:2
- 2011年
- 提出了基于语义相似度判别用户评价倾向的方法。利用同义词词林计算词语的相似度,由词语的相似度构造二部图,通过求二部图的最大匹配获得文本之间的相似度。依据KNN分类来判断文本的倾向性。实验结果表明该方法优于传统的倾向性判断的方法。
- 程传鹏
- 关键词:同义词词林文本相似度二部图