您的位置: 专家智库 > >

四川省科技攻关计划(07GG006-019)

作品数:13 被引量:56H指数:5
相关作者:朱颢东钟勇李红婵白江涛王颖更多>>
相关机构:中国科学院成都计算机应用研究所中国科学院研究生院郑州轻工业学院更多>>
发文基金:四川省科技计划项目四川省科技攻关计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 13篇中文期刊文章

领域

  • 13篇自动化与计算...

主题

  • 4篇属性约简
  • 4篇文档
  • 3篇文本分类
  • 3篇ID3算法
  • 2篇信息增益
  • 2篇搜索
  • 2篇凸函数
  • 2篇决策树
  • 2篇函数
  • 2篇粗糙集
  • 1篇多属性
  • 1篇信息系统
  • 1篇虚拟机
  • 1篇引擎
  • 1篇神经网
  • 1篇神经网络
  • 1篇实时性
  • 1篇搜索引擎
  • 1篇索引
  • 1篇亲和度

机构

  • 12篇中国科学院成...
  • 11篇中国科学院研...
  • 4篇郑州轻工业学...

作者

  • 13篇朱颢东
  • 11篇钟勇
  • 2篇李红婵
  • 1篇王颖
  • 1篇白江涛

传媒

  • 2篇华中科技大学...
  • 2篇上海交通大学...
  • 1篇哈尔滨工业大...
  • 1篇计算机工程
  • 1篇微电子学与计...
  • 1篇计算机应用
  • 1篇电子科技大学...
  • 1篇计算机应用研...
  • 1篇北京理工大学...
  • 1篇控制与决策
  • 1篇暨南大学学报...

年份

  • 1篇2011
  • 11篇2010
  • 1篇2009
13 条 记 录,以下是 1-10
排序方式:
相容关系的改进及其属性约简被引量:5
2010年
针对经典粗糙集理论处理不完备信息系统存在的局限性,作者从扩展粗糙集理论的适用范围出发,引入不完备信息系统对象的先验概率并结合量化相容关系的思想,提出了改进的相容关系模型.以该模型为基础研究了不完备信息系统的属性约简.通过严格的数学证明,给出了属性约简算法.该算法以空集为起点求取系统的约简,不需要计算核,节约了时间,减少了占用空间,简化了求解过程.通过实例验证该改进相容关系模型及其属性约简算法.
朱颢东钟勇
关键词:粗集不完备信息系统属性约简
一种多属性和准则定序分类模型被引量:1
2010年
针对经典粗糙集理论在解决定性属性、定量属性以及准则属性同时出现的定序分类问题时能力较弱的这种情况,对经典粗糙集理论进行扩展,并给出了一个基于扩展粗糙集的决策分析方法.该方法使用"不可区分-相似-优势"关系来代替经典粗糙集理论中的不可区分关系来获取知识的粗糙近似.实例验证表明该方法不但能够解决上述问题而且还能处理决策表中可能存在的不一致现象,具有较好的有效性与优越性.
朱颢东钟勇
关键词:粗糙集理论
基于实时性的Java虚拟机垃圾收集算法被引量:1
2010年
提出了一种适用于实时性环境的Java虚拟机垃圾收集算法。该算法对增量式收集器中堆空间的划分方式、引用跟踪等方面进行了改进,以减少垃圾收集带来的不确定性暂停,并可以使用户指定一个时间段内垃圾收集导致应用程序暂停的最长时间,从而使其适用于实时性环境。实验结果表明,该算法有效减少了暂停的频率和时长。
白江涛钟勇朱颢东
关键词:垃圾收集实时性
基于新型文档频和优化的Tabu搜索的特征选择
2010年
针对特征选择这一文本分类的核心问题,首先提出一个基于最小词频的文档频方法,然后引进粗糙集和Tabu搜索,分析了把Tabu搜索用于属性约简所存在的问题并给出了解决办法,并以此为基础详细设计了一个基于优化的Tabu搜索的属性约简方法,最后把上述两种方法结合起来提出了一个综合性特征选择方法.该方法利用基于最小词频的文档频方法提取初始特征,利用所给属性约简方法进行优选以消除冗余,从而获得较具代表性的特征子集.实验结果表明该综合方法优于IG,CHI和MI方法.
朱颢东钟勇
关键词:文本分类TABU搜索属性约简
基于粗糙集与泛系等价算子的特征选择被引量:1
2010年
传统特征选择方法选出的特征子集存在冗余,并且不具备较好的代表性。针对该问题,提出基于粗糙集与泛系等价算子的特征选择方法。利用基于最小词频的文档频提取初始特征,通过泛系等价算子对粗糙集进行扩展,并给出属性约简算法消除冗余,从而获得较具代表性的特征子集。实验结果表明,该方法具有较高的准确率和召回率。
朱颢东钟勇
关键词:文本分类粗糙集属性约简
ID3算法的优化被引量:7
2010年
针对ID3算法倾向于选择取值较多的属性的缺点,首先引入属性重要性进行改进,然后根据ID3算法中信息增益的计算特点,利用凸函数的性质进行简化,减少了信息增益的计算量,提高ID3算法中信息增益的计算效率.实验证明,优化ID3算法与传统ID3算法相比,在构造决策树时具有较高的准确率和更快的计算速度,并且构造的决策树还具有较少的平均叶子数.
朱颢东钟勇
关键词:决策树ID3算法信息增益凸函数
结合类内集中度和优化RBF神经网络的特征选择被引量:6
2011年
特征选择是文本分类的一个核心研究课题.首先提出了优化的文档频和类内集中度,紧接着提出了自适应量子粒子群优化算法并用于训练RBF网络的基函数中心和宽度,而且还结合最小二乘法计算网络权值,对RBF神经网络进行了优化,最后提出了一个综合性特征选择方法.该综合性方法首先使用类内集中度过滤掉一些词条以降低文本特征空间的稀疏性,然后再利用优化的RBF网络对特征进行优选.实验结果表明此种特征选择方法有较好的准确率和召回率.
朱颢东李红婵
关键词:文本分类量子粒子群优化RBF神经网络最小二乘法
ID3算法的改进和简化被引量:18
2010年
针对ID3算法倾向于选择取值较多的属性的缺点,引进属性重要性来改进ID3算法,并根据改进的ID3算法中信息增益的计算特点,利用凸函数的性质来简化该算法.实验表明,优化的ID3算法与原ID3算法相比,在构造决策树时具有较高的准确率和更快的计算速度,并且构造的决策树还具有较少的平均叶子数.
朱颢东
关键词:决策树ID3算法信息增益凸函数
基于中央控制节点的分布式网络蜘蛛的设计与实现
2010年
针对互联网日益增长的网页数量,提出了一种采用分布式技术设计实现的分布式网络蜘蛛(DWS)。该系统作为搜索引擎的前端,快速有效地下载网页,以获得整个Internet更加完整的映像。DWS设置中央控制节点来协调各个Web Spider的行为,以宽度优先搜素获得高质量的网页,通过对域名系统(DNS)缓存来提高访问Web Server的速度,增加并行线程数量增加下载速度,并能动态地加入Web Spider节点或子中央控制节点,具有很强的灵活性和扩张能力。
王颖钟勇朱颢东
关键词:搜索引擎分布式计算
基于NDF和优化的ID3的特征选择方法被引量:1
2010年
特征选择是文本分类中一个重要的课题.首先给出了一个新型文档频,然后把属性依赖度引入ID3并提出了一个基于优化ID3的属性约简算法,紧接着以此为基础,提出了一个新的特征选择方法.该特征选择方法使用改进的文档频初选特征并用所提属性约简算法消除冗余.仿真结果证明该特征选择方法是有效的.
朱颢东钟勇
关键词:ID3算法属性约简
共2页<12>
聚类工具0