您的位置: 专家智库 > >

福建省自然科学基金(2012J05117)

作品数:1 被引量:0H指数:0
相关作者:陈叶旺更多>>
相关机构:华侨大学更多>>
发文基金:中央高校基本科研业务费专项资金厦门市科技计划项目国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇语义
  • 1篇中文
  • 1篇中文网络
  • 1篇主题
  • 1篇网络
  • 1篇网络文本
  • 1篇百度百科
  • 1篇百科
  • 1篇抽取
  • 1篇抽取方法

机构

  • 1篇华侨大学

作者

  • 1篇陈叶旺

传媒

  • 1篇小型微型计算...

年份

  • 1篇2014
1 条 记 录,以下是 1-1
排序方式:
一种基于百度百科的中文网络文本关键词抽取方法
2014年
网络上存在海量的中文文本资源,其中有许多具有稀疏性与不规范性,这令以统计词组方式来抽取文本关键词的方法表现不佳.基于百度百科本文提出一种中文网络文本关键词抽取方法,通过百科知识关系将文本从外延词条集合映射到能体现其内涵的语义主题空间中,再利用主题间的关系进行权值调整,最后通过Nave Bayes法回溯并找到原文的关键词.该方法有效地避开穷举词条的统计方式,能在很大程度上解决现有文本挖掘方法无法抽取网络词汇和新生词汇这一难题.在两个数据集上的实验表明,该方法在规范的文本和不规范文本上都有着较好且稳定的表现.
陈叶旺
关键词:网络文本百度百科
共1页<1>
聚类工具0