王东海
- 作品数:4 被引量:7H指数:2
- 供职机构:长春工业大学计算机科学与工程学院更多>>
- 发文基金:吉林省科技厅平台建设基金吉林省教育厅“十二五”科学技术研究项目吉林省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于改进的最大熵模型的汉语词性自动标注的新方法被引量:3
- 2006年
- 最大熵模型已成为自然语言处理领域中的研究热点,但由于熟语料库规模的限制,模型参数会出现稀疏现象,影响了模型的精确度.另外最大熵模型参数众多、计算量大,一个好的参数估计算法将会有效地提高模型的效率.实验证明,采用BLMVM算法的基于Gaussian prior平滑技术的最大熵模型具有出色的表现.基于以上认识,结合汉语自身的特点,设计了一个基于词和字特征的汉语词性自动标注系统,取得了较好的标注效果.
- 赵伟赵法兴王东海韩达奇
- 关键词:最大熵模型词性标注GAUSSIAN
- 基于隐Markov模型汉语词性自动标注的若干分析与改进被引量:4
- 2007年
- 提出一种算法,用来高效地完成训练语料的大量工作,并解决好训练语料的扩充问题,然后基于Viterbi算法提出一些改进之策,结合训练语料工作完成后的结果在二元模型基础上,采用不同规模的训练语料对同一规模的测试语料进行测试、比较与分析,并提出模型的改进方向。
- 王东海赵伟陈洁梁贺
- 关键词:隐MARKOV模型词性标注VITERBI算法
- 基于隐Markov模型汉语词性自动标注的新算法
- 2013年
- 通过提出一种新的训练语料算法,结合训练语料在二元模型上采用正向与逆向双向扫描方法进行搜索,完成训练语料的扩充,并给出了对Viterbi算法的改进算法.对比实验在二元模型上采用不同规模的训练语料对同一规模的测试分析语料进行了分析.结果表明,该算法是可行的.
- 曲慧雁赵伟王东海李洁
- 关键词:隐MARKOV模型词性标注VITERBI算法
- 一种基于改进的最大熵模型的汉语词性自动标注的新方法
- 最大熵模型已成为自然语言处理领域中的研究热点,但由于熟语料库规模的限制,模型参数会出现稀疏现象,影响了模型的精确度.另外最大熵模型参数众多、计算量大,一个好的参数估计算法将会有效地提高模型的效率.实验证明,采用BLMVM...
- 赵伟赵法兴王东海韩达奇
- 关键词:最大熵模型词性标注
- 文献传递