周敬民
- 作品数:2 被引量:11H指数:1
- 供职机构:北京航空航天大学计算机学院软件开发环境国家重点实验室更多>>
- 发文基金:国家科技基础条件平台建设计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于Wikipedia的语义文本聚类模型
- 本文利用Wikipedia信息准确、全面的特点,从Wikipedia摘要中挖掘语义知识,构建了基于Wikipedia的语义文本聚类模型。该模型基于图论中寻找强连通子图的思想,发现了Wikipedia摘要中语义密切相关的词...
- 周敬民崔庆君张辉
- 关键词:WIKIPEDIA语义文本聚类
- 基于三维文档向量的自适应话题追踪器模型被引量:11
- 2010年
- 话题追踪(TT)是研究自动追踪事件动态发展过程的一种信息智能获取技术,是话题检测与追踪(TDT)技术的一个子任务,其目标在于自动发现新闻报道信息流中与某一已知话题有关的新报道。该文通过分析传统文档向量空间模型的不足,结合新闻报道的特征,提出了一种三维文档向量模型,在此基础上建立了一种符合新闻报道特征的话题模型。该话题模型在追踪过程中能够根据事件的动态发展进行自我学习和自我修正。结合话题模型,该文还设计了一种自适应的KNN新闻话题追踪器,从而形成了一种完整的中文话题追踪器模型。实验数据表明该方法在描述新闻话题、避免话题漂移方面具有一定优势,在中文话题追踪领域取得了较好效果。
- 张辉周敬民王亮赵莉萍