您的位置: 专家智库 > >

刘琼琼

作品数:1 被引量:1H指数:1
供职机构:吉林大学计算机科学与技术学院更多>>
发文基金:吉林省重大科技攻关项目国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇主题
  • 1篇网页
  • 1篇消歧
  • 1篇词性
  • 1篇词性标注
  • 1篇词义消歧

机构

  • 1篇吉林大学

作者

  • 1篇王英
  • 1篇左万利
  • 1篇刘琼琼

传媒

  • 1篇计算机科学

年份

  • 1篇2015
1 条 记 录,以下是 1-1
排序方式:
面向网页的主题概念挖掘被引量:1
2015年
网页主题挖掘对自然语言处理如网页文本分类、文摘自动生成、信息融合等具有重要意义。挖掘网页主题可以帮助用户更好地理解网页内容。尽管已有一些从普通文本中挖掘概念的工作,但其很少考虑单词所属标签和位置对单词权重的影响,且没有工作给出上述两种影响因子的计算方法。借助WordNet,将网页主题从词语扩展到概念层次,提出了使用词性标注和词义消歧确定网页中单词词义并充分利用标签影响因子和位置影响因子对网页正文文本特征进行权重修正的主题概念挖掘方法,给出了两种影响因子的计算公式。在DMOZ数据集上的实验结果表明,修正权重可以明显提高主题挖掘精度,最高可达到0.95。
刘琼琼左万利王英
关键词:词性标注词义消歧
共1页<1>
聚类工具0