您的位置: 专家智库 > >

李胜杰

作品数:3 被引量:9H指数:1
供职机构:河北大学数学与计算机学院更多>>
发文基金:河北省自然科学基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文

领域

  • 3篇自动化与计算...

主题

  • 3篇粗糙集
  • 3篇粗糙集技术
  • 1篇属性约简
  • 1篇统计分析
  • 1篇相容粗糙集
  • 1篇决策树
  • 1篇决策树归纳
  • 1篇割点
  • 1篇规则抽取
  • 1篇规则抽取方法
  • 1篇边界域
  • 1篇抽取
  • 1篇抽取方法

机构

  • 3篇河北大学
  • 1篇河北省机器学...

作者

  • 3篇李胜杰
  • 2篇翟俊海
  • 1篇王熙照
  • 1篇翟梦尧

传媒

  • 2篇计算机科学

年份

  • 3篇2012
3 条 记 录,以下是 1-3
排序方式:
基于相容粗糙集技术的连续值属性决策树归纳被引量:8
2012年
决策树是常用的数据挖掘方法,扩展属性的选择是决策树归纳的核心问题。基于离散化方法的连续值决策树归纳在选择扩展属性时,需要度量每一个条件属性的每一个割点的分类不确定性,并通过这些割点的不确定性选择扩展属性,其计算时间复杂度高。针对这一问题,提出了一种基于相容粗糙集技术的连续值属性决策树归纳方法。该方法首先利用相容粗糙集技术选择扩展属性,然后找出该属性的最优割点,分割样例集并递归地构建决策树。从理论上分析了该算法的计算时间复杂度,并在多个数据集上进行了实验。实验结果及对实验结果的统计分析均表明,提出的方法在计算复杂度和分类精度方面均优于其他相关方法。
翟俊海翟梦尧李胜杰
关键词:相容粗糙集决策树割点统计分析
基于粗糙集技术的分类规则抽取方法
归纳学习的核心问题是从给定的数据集中抽取分类规则,决策树归纳是一种典型的分类规则抽取方法,扩展属性的选择是决策树归纳的核心问题,基于离散化的连续值决策树归纳在选择扩展属性时,需要度量每一个条件属性的每一个割点的分类不确定...
李胜杰
关键词:粗糙集技术抽取方法属性约简
基于粗糙集技术的压缩近邻规则被引量:1
2012年
近邻(Nearest Neighbor,NN)算法是一种简单实用的监督分类算法。但NN算法在分类未知类标的样例时,需要存储整个训练集,还要计算该样例到训练集中每一个样例之间的距离,所以NN算法的计算复杂度非常高。为了克服这一缺点,P.Hart提出了压缩近邻(Condensed Nearest Neighbor,CNN)规则算法,即从整个训练集中找原样例集的一致子集(一致子集是能正确分类训练集中其他样例的子集)。其计算复杂度依然比较高,特别是对于大型数据库,寻找其一致子集是非常耗费时间的。针对这一问题,提出了基于粗糙集技术的压缩近邻规则算法。该算法分为3步,首先利用粗糙集方法求属性约简(特征选择),以将冗余的属性去掉。然后选取靠近边界域的样例,以将冗余的样例去掉。最后从选出的样例中计算一致子集。该算法能同时沿垂直方向和水平方法进行数据约简。实验结果显示,所提出的方法是行之有效的。
翟俊海李胜杰王熙照
关键词:粗糙集边界域
共1页<1>
聚类工具0