万菁
- 作品数:2 被引量:5H指数:1
- 供职机构:广东外语外贸大学更多>>
- 发文基金:中央高校基本科研业务费专项资金国家自然科学基金教育部人文社会科学研究基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于协同训练的文本蕴含识别被引量:1
- 2014年
- 针对文本蕴含的训练数据不足的问题,该文提出了基于协同训练的文本蕴含识别方法。该方法利用少量已标注的蕴含数据和大量未标注数据进行协同训练。为此,该文利用改写视图和评估视图,从结构和非结构两个角度考察蕴含关系,并将语义树核分类器和基于统计特征的分类器应用于两个视图,同时利用协同训练的结果训练一个综合分类器,用于对新数据进行预测。实验表明,基于协同训练的蕴含识别方法能在少量训练数据的情况下获得较好的识别性能。
- 任函万菁吴泓缈冯文贺
- 基于语言现象的文本蕴涵识别被引量:4
- 2017年
- 该文提出一种基于语言现象的文本蕴涵识别方法,该方法建立了一个语言现象识别和整体推理判断的联合分类模型,目的是对两个高度相关的任务进行统一学习,避免管道模型的错误传播问题并提升系统精度。针对语言现象识别,设计了22个专用特征和20个通用特征;为提高随机森林的泛化能力,提出一种基于特征选择的随机森林生成算法。实验结果表明,基于随机森林的联合分类模型能够有效识别语言现象和总体蕴涵关系。
- 任函冯文贺刘茂福万菁
- 关键词:语言现象