潘清清
- 作品数:2 被引量:8H指数:2
- 供职机构:昆明理工大学信息工程与自动化学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于最大熵的越南语新闻事件元素抽取方法被引量:2
- 2017年
- 越南与中国一水相依,是重要的政治、军事和经济合作邻国,然而针对越南语新闻事件元素的提取研究非常匮乏。本文针对越南语特点,提出一种基于最大熵模型的越南语新闻事件元素抽取方法。该方法针对越语句子结构和词汇语义的特点,采用最大熵算法,选取上下文、邻近触发词以及邻近实体作为特征,定义特征模版,训练获得越南语新闻事件模型,实现新闻事件元素抽取。抽取实验结果表明本文提出的方法抽取新闻事件元素的准确率达到80%以上。
- 周枫庙介璞潘清清严馨余正涛
- 关键词:越南语最大熵
- 基于条件随机场的越南语命名实体识别方法被引量:6
- 2014年
- 针对越南语特点,提出一种基于条件随机场模型的越语命名实体识别方法。该方法针对越语词和词性的特点,采用条件随机场算法,选取词和词性作为特征,定义特征模版,选取越南语新闻文本,标记地名、人名、组织机构等6类实体语料,训练获得越南语实体识别模型,实现实体识别。实验结果表明该方法提取实体的准确率达到83.73%。
- 潘清清周枫余正涛郭剑毅线岩团
- 关键词:越南语命名实体识别条件随机场