王凯
- 作品数:1 被引量:4H指数:1
- 供职机构:河北大学更多>>
- 发文基金:河北省自然科学基金国家自然科学基金保定市科技局科学技术研究与发展指导计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于SVM的离合词词义消歧被引量:4
- 2016年
- 离合词词义消歧要解决如何让计算机理解离合词中的歧义词在具体上下文中的含义。针对离合词中歧义词在机器翻译中造成的对照翻译不准确以及在信息检索中无法匹配有效信息等问题,将词义消歧的方法应用于离合词中的歧义词,采用SVM模型建立分类器。为了提高离合词词义消歧的正确率,在提取特征时,结合离合词的特点,不仅提取了歧义词上下文中的局部词、局部词性、局部词及词性3类特征,还提取了"离"形式的歧义词的中间插入部分的特征;将文本特征转换为特征向量时,对布尔权重法进行了改进,依次固定某种类型特征权重,分别改变另外两种类型特征权重的消歧正确率来验证3类特征的消歧效果。实验结果表明,局部词特征、局部词及词性特征对消歧效果的影响高于局部词性特征,且采用不同类型的特征权重与采用相同的权重相比,消歧正确率提高了1.03%~5.69%。
- 张振景李新福田学东王凯
- 关键词:离合词SVM词义消歧分类器