您的位置: 专家智库 > >

牛成

作品数:1 被引量:0H指数:0
供职机构:微软公司更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇语料
  • 1篇语料库
  • 1篇卡方检验
  • 1篇互信息
  • 1篇WEB
  • 1篇抽取
  • 1篇抽取方法
  • 1篇搭配

机构

  • 1篇哈尔滨工业大...
  • 1篇微软公司

作者

  • 1篇郑德权
  • 1篇林建方
  • 1篇李生
  • 1篇牛成

传媒

  • 1篇哈尔滨工业大...

年份

  • 1篇2010
1 条 记 录,以下是 1-1
排序方式:
Web数据反馈的搭配抽取方法
2010年
为了提高搭配(Collocation)抽取的精度,提出一种新的互联网数据的搭配抽取方法.传统的搭配抽取统计方法都是基于语料库的,常受到语料库规模的影响和制约,而在互联网数据中蕴含着丰富的知识和信息,基于Web的词汇相关性度量方法,充分利用搭配在谷歌中的页面数模拟其对应语料库的词频数,并分别选取共现频率、互信息、卡方检验3种经典统计关联度量方法.实验结果表明召回率、精确率均好于对应的基于语料库的方法,这说明互联网中大量数据应用于自然语言处理各种任务的可行性.
林建方牛成李生郑德权
关键词:搭配互信息卡方检验语料库WEB
共1页<1>
聚类工具0