国家自然科学基金(60763003)
- 作品数:3 被引量:14H指数:2
- 相关作者:乌达巴拉张贯虹华沙宝萨如拉萨仁图雅更多>>
- 相关机构:内蒙古大学中国科学院合肥物质科学研究院合肥学院更多>>
- 发文基金:国家自然科学基金教育部人文社会科学研究基金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 蒙古语依存树库的构建
- 蒙古语信息处理己完成字、词处理阶段的基本任务,正在步入句处理阶段。为了给后续的句法分析提供训练和评测数据,我们在内蒙古大学100万词级现代蒙古语料库的基础上,采用自动分析和人工校对的方法构建了蒙古语依存树库。目前,该树库...
- 斯·劳格劳萨如拉
- 关键词:蒙古语依存语法树库
- 文献传递
- 蒙古语助动词标注与分析
- 蒙古语助动词的判别涉及蒙古语词法、句法和语义问题,是蒙古语语法学较难的研究课题之一。作者对助动词在真实文本中的分布特征进行分析,描述与助动词共现词语的形态变化、词类等特征,归纳蒙古语23条常用助动词的判别规则。在此基础上...
- 达胡白乙拉萨仁图雅
- 关键词:蒙古语助动词
- 文献传递
- 基于统计方法的蒙古语依存句法分析模型被引量:3
- 2012年
- 蒙古语文信息处理已初步完成字、词处理阶段的基本任务,正在步入句处理阶段,并且在国家自然科学基金的资助下构建了蒙古语依存树库MDTB。该文以MDTB为训练和评测数据,设计实现了一种基于词汇依存概率的蒙古语依存句法分析模型。目前,该模型的无标记准确率、有标记准确率和核心词准确率分别达到了71.24%、61.42%和93.05%。
- 斯.劳格劳华沙宝萨如拉
- 关键词:蒙古文依存语法句法分析
- 基于统计方法的蒙古语依存句法分析模型
- 蒙古语文信息处理已初步完成字、词处理阶段的基本任务,正在步入句处理阶段,并且在国家自然科学基金的资助下构建了蒙古语依存树库MDTB。本文以MDTB为训练和评测数据,设计实现了一种基于词汇依存概率的蒙古语依存句法分析模型。...
- 斯·劳格劳华沙宝萨如拉
- 关键词:蒙古文依存语法句法分析
- 文献传递
- 蒙古语助动词标注与分析被引量:1
- 2010年
- 蒙古语助动词的判别涉及蒙古语词法、句法和语义问题,是蒙古语语法学较难的研究课题之一。作者对助动词在真实文本中的分布特征进行分析,描述与助动词共现词语的形态变化、词类等特征,归纳蒙古语23条常用助动词的判别规则。在此基础上,研制助动词标注软件,对现代蒙古语语料库进行标注,分析标注错误例子,改进了助动词标注软件。再测试表明,改进后的规则可以准确判别100万词级现代蒙古语语料库的绝大多数助动词。
- 达胡白乙拉萨仁图雅
- 关键词:蒙古语助动词
- 融合形态特征的最大熵蒙古文词性标注模型被引量:10
- 2011年
- 最大熵模型以其能够较好地包容各种约束信息及与自然语言模型相适应等优点在词性标注研究中取得了良好的效果.因此,将其作为基本框架,提出了一种融合语言特征的最大熵蒙古文词性标注模型.首先,根据蒙古文构词特点及统计分析结果,定义并选取特征模板,利用训练语料提取了大量的候选特征集合,针对错误或者无效的特征通过设置一些规则筛选特征.然后,训练最大熵概率模型参数.实验结果表明,融合蒙古文形态特征的最大熵模型可以较好地标注蒙古文.
- 张贯虹斯.劳格劳乌达巴拉
- 关键词:最大熵模型蒙古文词性标注参数估计