您的位置: 专家智库 > >

国家自然科学基金(60773070)

作品数:2 被引量:31H指数:1
相关作者:徐志明王晓龙徐永东更多>>
相关机构:哈尔滨工业大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 2篇会议论文

领域

  • 4篇自动化与计算...

主题

  • 1篇多文档
  • 1篇多文档自动文...
  • 1篇信息融合
  • 1篇用户
  • 1篇用户模型
  • 1篇用户兴趣
  • 1篇用户兴趣模型
  • 1篇自动文摘
  • 1篇文本分类
  • 1篇文本分类算法
  • 1篇文本相似度
  • 1篇文档
  • 1篇文摘
  • 1篇相似度
  • 1篇模式识别
  • 1篇仿生模式识别
  • 1篇MUTUAL...
  • 1篇PATTER...
  • 1篇BASED_...
  • 1篇FEATUR...

机构

  • 3篇哈尔滨工业大...

作者

  • 3篇徐志明
  • 1篇徐永东
  • 1篇丛帅
  • 1篇王晓龙
  • 1篇雷萌
  • 1篇李生
  • 1篇王宇颖

传媒

  • 1篇计算机学报
  • 1篇Journa...
  • 1篇第六届全国信...

年份

  • 1篇2011
  • 1篇2010
  • 1篇2009
  • 1篇2007
2 条 记 录,以下是 1-4
排序方式:
Feature selection algorithm for text classification based on improved mutual information被引量:1
2011年
In order to solve the poor performance in text classification when using traditional formula of mutual information (MI) , a feature selection algorithm were proposed based on improved mutual information. The improved mutual information algorithm, which is on the basis of traditional improved mutual information methods that enbance the MI value of negative characteristics and feature' s frequency, supports the concept of concentration degree and dispersion degree. In accordance with the concept of concentration degree and dispersion degree, formulas which embody concentration degree and dispersion degree were constructed and the improved mutual information was implemented based on these. In this paper, the feature selection algorithm was applied based on improved mutual information to a text classifier based on Biomimetic Pattern Recognition and it was compared with several other feature selection methods. The experimental results showed that the improved mutu- al information feature selection method greatly enhances the performance compared with traditional mutual information feature selection methods and the performance is better than that of information gain. Through the introduction of the concept of concentration degree and dispersion degree, the improved mutual information feature selection method greatly improves the performance of text classification system.
丛帅张积宾徐志明王宇颖
一种基于分类的用户兴趣模型
本文研究了一种基于分类的用户兴趣模型。该模型主要将用户查询历史和用户感兴趣的相关文档视为用户兴趣数据的来源,来挖掘用户兴趣信息。根据向量空间模型,我们将基于分类的用户兴趣模型表示成用户兴趣向量形式,并根据Fan Liu[...
徐志明宋毅冯子威李生
关键词:用户模型
文献传递
基于信息融合的多文档自动文摘技术被引量:30
2007年
提出了一个面向多文档自动文摘任务的多文本框架(Multiple Document Framework,MDF),该框架通过系统地描述不同层面的文本单元之间的相互关系以及文档集合蕴含的事件在时间上的发生及演变,将多篇文档在不损失文档集合原有信息的前提下实现信息融合.MDF简化了传统交叉文本结构理论的文本集合表示模型,又补充了信息融合理论中缺乏的事件主题的演变性和分布性信息.文中给出了建立MDF、基于MDF的信息融合、文摘生成等一整套算法.通过对32组不同主题的网络文档试验结果表明,MDF策略很好地实现了多知识源的并行融合,并获得了较好的结果.
徐永东徐志明王晓龙
关键词:多文档自动文摘信息融合
基于仿生模式识别文本分类算法
仿生模式识别是一种不同于传统模式识别的理论方法,其理论基点是特征空间中同源样本的连续性原理,并通过对同类样本在高维空间中的最佳覆盖来达到认识和区分样本的目的。本文对仿生模式识别算法进行了深入的研究与学习,将仿生模式识别的...
徐志明丛帅王宇颖雷萌
关键词:文本分类仿生模式识别文本相似度
文献传递
共1页<1>
聚类工具0