税仪冬
- 作品数:3 被引量:29H指数:1
- 供职机构:北京交通大学计算机与信息技术学院更多>>
- 发文基金:教育部科学技术研究重点项目中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术更多>>
- 周期分类和Single-Pass聚类相结合的话题识别与跟踪方法
- 话题识别与跟踪是对新闻媒体信息流中新话题的自动识别以及对已知话题的动态跟踪,其处理对象是随时间动态变化的语言信息流,而不是静态、封闭的文本集合,突发性新闻的先验知识通常很少,即存在先验相关报道的稀疏性,因此增量式聚类初始...
- 税仪冬瞿有利黄厚宽
- 关键词:TDT话题识别与跟踪增量聚类文本分类
- 周期分类和Single-Pass聚类相结合的话题识别与跟踪方法被引量:28
- 2009年
- 针对增量式聚类初始时话题模型不够充分和准确,随处理报道数量增加,误检与漏检的累积效应被放大的问题,提出了周期分类和Single-Pass聚类相结合的话题识别与跟踪方法.首先采用增量式聚类算法进行话题识别与跟踪,当新闻文本每积累到一定程度之后,对已经聚类的报道进行周期分类,使话题簇精度提高,从而提高后续话题识别与跟踪精度.实验表明这种方法是有效的,能够降低漏检率与错检率,减少归一化错误识别代价.
- 税仪冬瞿有利黄厚宽
- 关键词:话题识别与跟踪增量聚类文本分类
- 相关实体发现中基于Wikipedia的实体排序被引量:1
- 2014年
- 针对相关实体发现中基于Wikipedia的实体排序存在的问题:半自动的目标类型获取、粗粒度的目标类型、实体类型相关度二值判断、实体关系相关度计算未考虑停止词作用.设计了一个实体排序框架,从实体相关度、实体类型相关度和实体关系相关度3方面的组合计算来对实体进行排序,通过对比多种组合方法获取了最优的方法.提出了一种新的实体类型相关度计算方法,该方法可以自动获取细粒度的目标实体类型,并通过归纳学习获取其下义Wikipedia类别判别规则集合,通过统计候选实体类别信息中符合目标类型下义类别判别规则的类别数来计算实体类型相关度.提出了一种"去停止词重构关系"方法计算候选实体和源实体的关系相关度.实验表明提出的方法可以有效地提高实体排序效果并且降低计算时间耗费.
- 张俊三瞿有利税仪冬田盛丰
- 关键词:WIKIPEDIA