云南省智能信息处理研究所
- 作品数:15 被引量:70H指数:4
- 相关作者:张月红更多>>
- 相关机构:昆明理工大学郑州大学昆明冶金高等专科学校更多>>
- 发文基金:国家自然科学基金云南省自然科学基金云南省教育厅科学研究基金更多>>
- 相关领域:自动化与计算机技术交通运输工程理学语言文字更多>>
- 受限域FAQ中文问答系统研究被引量:6
- 2007年
- 在受限域中采用常问问题(FAQ)实现业务咨询系统是一种较好的问答模式,提出了一种受限域FAQ问答系统模型,借助于本体论的思想,构建了领域知识库,利用KDML语言定义和描述了领域本体及本体之间的关系,并实现了领域知识库"领域知网"与常识库"知网"的融合.在此基础上,提出了一种问句相似度的计算方法,该方法借助领域问句所具有的特点,结合问句中的词法关系、句法依存关系及领域概念关系,实现问句相似度计算.并以相似度计算为基础,从侯选问题集中检索相关问句,提取问题答案.云南旅游FAQ问答原型系统测试结果表明该方法可行,有较好的效果.
- 余正涛邓锦辉韩露毛存礼郑志蕴郭剑毅
- 关键词:问句相似度
- 纳-汉双语语料库构建及双语语料对齐被引量:2
- 2009年
- 当前存在着部分纳西语-汉语双语互译文本,利用这些双语互译文本构建大规模的双语语料库,是双语互译文本的深层加工及其双语词典编纂、跨语言信息检索面临的关键问题。提出了一个大规模纳-汉双语语料库的构建方案,包括其总体规划标准制定、实施方案和流程细节。通过组织构建纳-汉双语语料库,实现双语语料库在统计的机器翻译系统中的应用,并实现纳-汉之间的双语对照翻译系统,较好地提高翻译的准确性和可读性,进而推动少数民族语言信息化的发展。
- 赵芳婷余正涛线岩团郭剑毅毛存礼候波
- 关键词:双语语料库双语对照机器翻译
- 中文专家实体主页识别方法研究
- 2011年
- 专家实体主页识别是专家检索的一个重要的组成部分,本文提出了一种基于J48的机器学习算法来对中文专家实体主页进行分类识别。首先,人工收集中文专家实体及对应的专家主页面2 113个,针对中文专家实体特点,定义与链接和网页内容特征相关的专家实体特征,并对这些特征进行提取,形成训练数据集。然后,采用不同学习算法对在不同特征上的页面进行主页识别,寻找最有效的分类特征和主页识别学习算法。最后,对不同特征、不同算法进行测试,实验结果表明,采用J48算法,结合链接与网页内容特征,中文专家实体主页识别取得了较好的效果,其识别准确率达到了81.05%。
- 李丽娜余正涛王亚盛毛存礼郭剑毅
- 关键词:链接特征网页特征
- 旅游领域实体答案的抽取被引量:2
- 2009年
- 提出一种基于模式匹配与命名实体识别相结合的领域答案抽取方法,该方法用答案模式串、答案模式权值和答案类型三要素来定义并构建答案模式库,结合旅游领域命名实体识别方法和模式匹配方法,实现了旅游领域实体答案的抽取。在旅游领域进行实体答案抽取实验,取得了较好的效果,其中召回率达88.78%,准确率达86.04%。
- 李桂兰余正涛毛存礼郭剑毅侯波线岩团
- 关键词:答案抽取命名实体识别
- 改进遗传算法求解交通最优路径的实现被引量:4
- 2009年
- 针对在现实生活中的智能交通诱导系统中求解实时最优路径问题,根据实时交通信息,以车辆周转时间最短,提高路网道路运行效率为目标建立模型.在基本遗传算法中引入了一种新的带染色体交叉控制策略得到改进遗传算法,并配合循环交叉,来求解实时最优路径.通过实验结果来说明该方法的是有效的.
- 王海雄郭剑毅张月红
- 关键词:遗传算法交通诱导控制策略
- 受限域FAQ中文问答系统研究
- 在受限域中采用常问问题(FAQ)实现业务咨询系统是一种较好的问答模式,提出了一种受限域FAQ问答系统模型,借助于本体论的思想,构建了领域知识库,利用KDML语言定义和描述了领域本体及本体之间的关系,并实现了领域知识库'领...
- 余正涛邓锦辉韩露毛存礼郑志蕴郭剑毅
- 关键词:问句相似度中文问答系统
- 文献传递
- 基于层叠条件随机场的旅游领域命名实体识别被引量:37
- 2009年
- 针对旅游领域,提出了一种基于层叠条件随机场模型的旅游领域命名实体识别方法。该方法在低层条件随机场中以字为切分粒度,结合旅游景点常用字表、景点常用后缀表、地名常用字表等特征词典,实现简单旅游命名实体的识别;其识别结果传递到高层模型,以词为切分粒度,结合复杂特征,实现嵌套景点、特产风味、地点的识别。最后进行了两组相关实验,结果表明,在开放测试中,层叠条件随机场模型相比于单层模型,F值提高了8个百分点;相比于HMM模型,正确率提高了8个百分点,召回率提高了22个百分点,F值提高了15个百分点。
- 郭剑毅薛征山余正涛张志坤张宜浩姚贤明
- 关键词:计算机应用中文信息处理旅游领域命名实体识别层叠条件随机场
- 领域问答系统答案提取方法研究
- 在特定领域问答系统中,领域知识直接影响问答效果,本文提出了一种领域问答答案提取方法,以问题分析得到问题查询、问题类型及答案类型为基础,借助领域知识检索获得答案提取候选段落,对于定义性问题,结合关键词加权权重计算方法与句子...
- 毛存礼余正涛韩露郭剑毅李丽娜雷雄丽
- 关键词:问答系统领域知识
- 基于HMM的中文旅游景点的识别被引量:11
- 2009年
- 针对旅游领域,提出了一种基于隐马尔可夫模型(HMM)的旅游景点实体识别方法.该方法采用HMM学习算法,选取句子各态顺序遍历模型,结合词性特征和校正规则实现了旅游景点的自动识别.最后进行了旅游景点实体识别测试实验,结果表明所提方法取得了较好的效果.其中,开放测试识别准确率、召回率、F值分别达到了83.4%、95.7%、89.1%.
- 薛征山郭剑毅余正涛张志坤姚贤明
- 关键词:命名实体识别HMM旅游景点
- 中文问答对过滤方法研究
- 问答对(Frequently Asked Question and Answer Pair)过滤是准确自动获取问答对的关键。本文提出了针对领域和面向句子的中文问答对过滤方法。结合句法结构关系和领域特征,选取句子主干与领域...
- 毛煜余正涛孟祥燕张志坤许洋波郭剑毅