您的位置: 专家智库 > >

季姮

作品数:3 被引量:51H指数:2
供职机构:清华大学人文学院计算语言学研究室更多>>
发文基金:国家自然科学基金更多>>
相关领域:语言文字自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇会议论文

领域

  • 2篇语言文字
  • 1篇自动化与计算...

主题

  • 3篇中文
  • 2篇姓名
  • 2篇中文姓名
  • 1篇信息处理
  • 1篇语义
  • 1篇数据稀疏
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇主题概念
  • 1篇自动辨识
  • 1篇向量
  • 1篇向量空间
  • 1篇向量空间模型
  • 1篇邻接
  • 1篇计算机
  • 1篇计算机应用
  • 1篇候选
  • 1篇概率分布
  • 1篇层次分析

机构

  • 3篇清华大学

作者

  • 3篇罗振声
  • 3篇季姮
  • 1篇万敏
  • 1篇高小云

传媒

  • 1篇语言文字应用
  • 1篇中文信息学报

年份

  • 1篇2003
  • 2篇2001
3 条 记 录,以下是 1-3
排序方式:
基于反比概率模型和规则的中文姓名自动辨识系统
中文姓名的辨识是自动分词、自动文摘的基础.我们提出了基于语料库统计的反比姓名概率模型,并结合上下文模式、邻接链、特殊姓、位置依存信息等四个辨识模块,设计了一个中文姓名辨识系统.本文描述了本系统的算法,测试结果表明系统有较...
季姮罗振声
关键词:数据稀疏
基于统计和规则的中文姓名自动辨识被引量:24
2001年
中文姓名的辨识是自动分词、自动文摘的基础。独立于自动分词 ,我们运用姓名用字概率和规则 ,设计并实现了一个中文姓名辨识系统。对 2 0 775 7字语料进行了测试 ,召回率达到 92 .5 7% ,精确率达到 80 .35 % ,且速度较快。
季姮罗振声
关键词:概率分布
基于概念统计和语义层次分析的英文自动文摘研究被引量:27
2003年
传统的自动文摘方法基于词语统计抽取文摘句 ,未进行文本的语义分析 ,导致文摘精度不高。为了克服传统方法的缺点 ,本文提出了一种基于主题概念的自动文摘方法 ,以概念统计和层次分析为基础设计并实现了一个英文自动文摘系统。系统利用WordNet以概念统计代替传统的词频统计 ,基于主题概念构建向量空间模型 ,计算句子重要度。并且根据主题概念在概念层次树上的分布进行文本结构分析划分意义块 ,以意义块为单元抽取文摘 ,初步解决了多主题文章的文摘结构不平衡问题。本文主要介绍了概念层次树的构造 ,主题概念的抽取步骤 ,基于主题概念的句子重要度的计算和意义块的划分算法。测试表明 ,通过概念统计和语义层次分析的方法 ,我们设计了更理想的向量空间模型 ,系统生成的文摘精度较高 。
季姮罗振声万敏高小云
关键词:计算机应用中文信息处理主题概念向量空间模型
共1页<1>
聚类工具0