刘路
- 作品数:3 被引量:7H指数:1
- 供职机构:解放军信息工程大学信息工程学院更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于正反例训练的SVM命名实体关系抽取被引量:6
- 2008年
- 根据中文命名实体关系抽取的特点,从中文的形态学、语法及语义等几个方面选取特征并构建特征向量,然后将符合特定实体关系模板的候选命名实体对抽取出来并分为正反例。利用正反例样本对支持向量机(SVM)抽取器进行训练,以此来判断候选命名实体对的关系类型。实验证明,本方法能够有效提高中文命名实体关系抽取的准确率。
- 刘路李弼程张先飞
- 关键词:SVM算法
- 基于向量相似度修正策略的命名实体关联分析
- 2008年
- 关联分析是数据挖掘技术中的一种重要方法,代表性算法有FP-growth算法和MAXFP-Miner算法。命名实体包含了文本的主要内容,蕴含了丰富的知识模式。针对命名实体的特点,提出一种基于向量相似度比较的关联规则修正策略,将此修正策略应用于MAXFP-Miner算法中,得到一种改进的MAXFP-Miner算法;利用该算法对命名实体之间的内在联系进行分析,从中发现有意义的知识模式。实验结果与性能比较表明,改进的MAXFP-Miner算法是有效的,优于传统的FP-growth算法和MAXFP-Miner算法。
- 刘路李弼程张先飞
- 关键词:知识发现
- 基于单实体语言模型的实体关系发现和描述被引量:1
- 2008年
- 传统中文实体关系抽取方法大都采用基于共现实体对的上下文模型,这种模型会遗失很多潜在的实体关系,并且无法对相似的实体关系给出合理的描述信息。针对这一局限性,文章提出一种基于单实体的上下文语言模型。通过对文本集中的所有实体建立上下文语言模型,来计算实体之间的相似度以及上下文词汇的贡献度得分,从而发现相似度较高的实体对,并获得实体关系的描述信息。实验证明,与传统方法相比,本文方法能够发现更丰富的实体关系,描述信息也更加准确。
- 刘路李弼程张先飞孙显著
- 关键词:语言模型