赵红改
- 作品数:4 被引量:10H指数:3
- 供职机构:北京信息科技大学中文信息处理研究中心更多>>
- 发文基金:国家社会科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 搜索引擎日志中“N+V”和“N_1+N_2+V”型短语自动识别被引量:2
- 2012年
- 正确识别搜索引擎日志中的短语,对搜索引擎用短语词典构建和提高搜索引擎性能具有重要的作用。该文提出一种应用条件随机场实现对搜狗日志语料中"N+V"和"N1+N2+V"型短语自动识别的方法。模型的特征集包含词、词性和词语长度。由人工设计候选特征集,从中选择有效的特征构成特征模板,训练生成用于短语自动识别的条件随机场模型。封闭测试和开放测试的实验结果表明,模型能够实现对这两种短语的有效识别。
- 赵红改吕学强施水才郑丽
- 关键词:条件随机场模型搜索引擎日志
- 搜索引擎日志中“N_1+N_2+V”型名词短语研究被引量:3
- 2011年
- "N1+N2+V"结构是组成名词短语的一种基本形式。本文基于搜狗日志语料,对搜索引擎日志中的"N1+N2+V"型名词短语进行研究。针对语料自身的特点,从句法特征、短语的层次切分与拆分、句法功能和语义关系4方面,对这类短语进行了考察,着重分析了N1与N2、N2与V的语义关系。文中对搜狗日志的查询内容进行了深入分析和实证,为搜索引擎用短语词典的构建研究提供理论依据。
- 肖诗斌赵红改王洪俊吕学强
- 关键词:搜索引擎日志句法特征句法功能语义关系
- 搜索引擎日志中“N+V”型主谓短语研究被引量:3
- 2011年
- "N+V"型结构能够构成定中偏正、状中偏正和主谓三种不同结构的短语。基于搜狗日志语料,对"N+V"型主谓短语从其各组成要素特点、音节特点和句法功能三方面进行研究,着重从语义方面对"V"进行阐述。文中,还对实验数据进行深入的分析和实证,针对"N+V"型短语的句法结构歧义问题,提供了解决方案,这为提高中文搜索引擎的检索质量和搜索引擎用短语词典构建提供了重要的理论依据。
- 赵红改肖诗斌王洪俊吕学强
- 关键词:搜索引擎主谓短语句法功能
- 搜索引擎日志中“N+V”型短语分析被引量:3
- 2012年
- 句法分析是自然语言处理中的一个难点和重点。基于搜狗日志语料,提出一种用层叠条件随机场模型实现搜索引擎日志中"N+V"型短语分析的方法。将短语分析分为两个阶段:"N+V"型短语内部结构分析和外部功能分析。这为"N+N+V"型短语和"N+V+V"型短语等外显型歧义结构的消歧提供了解决方法,从而为搜索引擎用短语词典构建提供基础研究服务。
- 赵红改吕学强肖诗斌