青岛市公共领域科技支撑计划项目(10-3-3-32-nsh)
- 作品数:1 被引量:2H指数:1
- 相关作者:刘彤汤建渝曾庆田倪维健赵华更多>>
- 相关机构:山东科技大学更多>>
- 发文基金:中国博士后科学基金山东省统计科研重点课题青岛市公共领域科技支撑计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 一个面向主题的学术文献数据分析工具
- 学术文献数量的迅速增长给科研工作者的文献调研工作带来了巨大的负担,因此设计并实现了一个面向主题的学术文献分析工具,为科研工作者从海量学术文献中快速准确地发现学科研究特性、分析学科发展趋势提供支持.本工具使用Latent ...
- 倪维健柳梅曾庆田刘彤汤建渝
- 关键词:主题模型LDA
- 文献传递
- 基于非平衡数据分类的单文档自动文摘方法被引量:2
- 2012年
- 自动文摘是自然语言处理领域的一个重要研究话题,基于机器学习的自动文摘方法则是该项研究中的一个热点。然而,自动文摘问题中的数据分布有一个重要现象,即文摘句子与非文摘句子的数量相差非常悬殊,该现象将给传统机器学习算法的应用效果带来负面影响。为此,本文针对自动文摘中句子类别分布严重不平衡这一现象,以支持向量机算法为基础,设计了两种有效的处理非平衡自动文摘数据的分类方法。在第一种方法中,将传统支持向量机中正负类平衡的分类间隔转换为不平衡的分类间隔;在第二种方法中,通过将数据集进行切分,设计了一种支持向量机集成学习算法。通过在DUC2001数据集上的实验证明,本文设计的两种基于非平衡数据分类的单文档自动文摘方法显著优于基于传统分类算法的自动文摘方法。
- 倪维健刘彤曾庆田赵华汤建渝
- 关键词:非平衡数据分类支持向量机分类器集成