施德明
- 作品数:4 被引量:18H指数:2
- 供职机构:中国科学技术大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金安徽省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种集成NER的文本分类特征选择方法被引量:2
- 2007年
- 文本分类是将自由文本自动划分到若干预先定义类别的方法,在信息检索等领域有很重要的作用。其中,如何选择有效的文本特征是影响文本分类器分类性能的一个重要步骤。很多应用中需要处理的文本信息包含了很多的命名实体,如某个行业的名人,往往能够在很大程度上影响着文本所属的类别。然而,现阶段的文本特征方法都只利用关键词的统计意义,而没有考虑关键词作为命名实体所含有的分类特征。针对这一问题,本文提出了一种将命名实体识别方法NER集成到文本分类特征选择中的方法,在保留关键词统计特征之外,还保留了单词作为命名实体的分类特征。实验结果表明,相对于其他特征选择方法而言,本文提出的方法在一定程度上提高了文本分类的分类准确率。
- 施德明林洋港陈恩红
- 关键词:命名实体识别文本分类隐马尔可夫模型
- 一种基于本体的语义信息检索模型与实现
- 随着网络信息的日益丰富以及下一代知识网络的来临,基于概念匹配的语义信息检索技术成为了当前研究的热点.该文提出并实现了一种新的基于本体的语义信息检索模型,利用本体对用户查询和被检索文档进行语义处理后,以计算概念相似度和属性...
- 王进陈恩红施德明
- 关键词:计算机应用中文信息处理本体语义信息检索
- 文献传递
- 一种基于语义相似度的信息检索方法被引量:16
- 2006年
- 随着网络信息的日益丰富以及语义网络的出现,语义信息检索技术成为当前研究的热点。本文研究一种基于语义相似度的信息检索方法,利用本体在语义刻画上的优势,以概念相似度和属性相似度作为语义检索的衡量依据,对语义检索过程的分析和结果的统计表明,文档语义特征向量的概念及属性数的增加有利于改善检索效果。
- 王进陈恩红施德明张振亚
- 关键词:本体语义信息检索
- 集成命名实体的文本分类特征选择方法研究
- 文本分类是将自由文本自动划分到若干预先定义类别的方法,在信息检索等领域有很重要的作用。其中,如何选择有效的文本特征,是影响文本分类器的分类性能的一个关键步骤。对于很多需要处理的文本信息中,包含了很多的命名实体,如某个行业...
- 施德明
- 关键词:命名实体识别隐马尔可夫模型文本分类支持向量机信息检索
- 文献传递