陈科文
- 作品数:9 被引量:89H指数:3
- 供职机构:中南大学更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术矿业工程文化科学更多>>
- 文本分类中基于熵的词权重计算方法研究被引量:11
- 2016年
- 随着文本数据量变得很大且仍在迅猛增加,自动文本分类变得越来越重要。为了提高分类准确率,作为文本特征的词的权重计算方法是文本分类领域的研究热点之一。研究发现,基于信息熵的权重计算方法(熵加权)相对于其他方法更有效,但现有方法仍然存在问题,比如在某些语料库上相比TF-IDF(term frequency&inverse document frequency),它们可能表现较差。于是将对数词频与一个新的基于熵的类别区分力度量因子相结合,提出了LTF-ECDP(logarithmic term frequency&entropy-based class distinguishing power)方法。通过在Tan Corp、Web KB和20 Newsgroups语料库上使用支持向量机(support vector machine,SVM)进行一系列文本分类实验,验证和比较了8种词权重计算方法的性能。实验结果表明,LTF-ECDP方法比其他熵加权方法和TF-IDF、TF-RF(term frequency&relevance frequency)等著名方法更优越,不仅提高了文本分类准确率,而且在不同数据集上的性能更加稳定。
- 陈科文张祖平龙军
- 关键词:特征词权重文本分类
- Web文档的自隐自现导航目录页的设计
- 2003年
- 本文介绍一种实用新颖的自隐自现导航目录页的设计方法,这种目录页既能为文档浏览者导航,又可节省版面空间,其设计技巧特别是对于教学网页的设计有一定指导意义。
- 陈科文
- 关键词:网络浏览器网页WEB文档
- 基于TF-IGM的文本特征向量生成方法和装置及文本分类方法和装置
- 本发明公开了一种基于TF-IGM的文本特征向量生成方法和装置及文本分类方法和装置,通过建立反重力矩(IGM)模型来计算特征词在不同类别文本中分布的集中度,并在此基础上计算特征词的权重。计算所得权重更能逼真地反映特征词在文...
- 龙军陈科文张祖平杨柳
- 文献传递
- 一种基于信息熵的文本特征量化方法和装置及文本分类方法和装置
- 本发明公开了一种基于信息熵的文本特征量化方法和装置及文本分类方法和装置,根据特征词在文本文档内的词频和在不同文本类别上分布的信息熵来计算文档内各特征词的权重;同时可根据文本集各类别规模的非平衡性采用不同方式来计算特征词的...
- 陈科文张祖平龙军胡扬
- 文献传递
- 一种基于信息熵的文本特征量化方法和装置及文本分类方法和装置
- 本发明公开了一种基于信息熵的文本特征量化方法和装置及文本分类方法和装置,根据特征词在文本文档内的词频和在不同文本类别上分布的信息熵来计算文档内各特征词的权重;同时可根据文本集各类别规模的非平衡性采用不同方式来计算特征词的...
- 陈科文张祖平龙军胡扬
- 文献传递
- 基于TF-IGM的文本特征向量生成方法和装置及文本分类方法和装置
- 本发明公开了一种基于TF-IGM的文本特征向量生成方法和装置及文本分类方法和装置,通过建立反重力矩(IGM)模型来计算特征词在不同类别文本中分布的集中度,并在此基础上计算特征词的权重。计算所得权重更能逼真地反映特征词在文...
- 龙军陈科文张祖平杨柳
- 文献传递
- 教学网页的设计被引量:2
- 2001年
- 针对如何有效地组织教学网页的信息,以方便用户检索和抓住要点,本文介绍了有关的设计思想,主要包括在网页中添加″选项卡″功能等。
- 陈科文邓庚香王军
- 关键词:教学网页主页浏览窗口计算机辅助教学
- 多源信息融合关键问题、研究进展与新动向被引量:66
- 2013年
- 近年来,国内外掀起了多源信息融合技术研究的新热潮。对信息融合技术的最新研究进展进行了综述;首先探讨了信息融合的概念与本质;然后从信息处理和融合系统设计的角度,全面阐述了信息融合所面临的问题与挑战,以及现有的主要融合模型与方法分类,同时分析了信息融合方法论研究的发展趋势和一些新领域;接着纵览了信息融合技术的广泛应用;特别讨论了几个新兴的应用领域。最后对信息融合研究路线作了总结和展望。
- 陈科文张祖平龙军
- 关键词:信息融合
- 信息科技在采矿工业中的应用与展望被引量:10
- 2002年
- 采矿等传统产业要实现飞跃发展 ,必须与信息科技相结合。从计算机技术、人工智能、通信技术等三个方面阐述了信息科技在采矿工业中的应用与发展 ;最后指出 :目前我国矿山企业信息化改造的薄弱环节是生产技术的改造 。
- 陈科文古德生
- 关键词:采矿工业信息科技人工智能通信计算机生产技术