国家科技成果重点推广计划(2003EC000001)
- 作品数:36 被引量:196H指数:8
- 相关作者:杨炳儒宋威徐章艳张伟张克君更多>>
- 相关机构:北京科技大学北华大学广西师范大学更多>>
- 发文基金:国家科技成果重点推广计划国家自然科学基金教育部科学技术研究重点项目更多>>
- 相关领域:自动化与计算机技术文化科学经济管理建筑科学更多>>
- 新型决策树构造方法被引量:2
- 2009年
- 决策树是一种重要的数据挖掘工具,但构造最优决策树是一个NP-完全问题。提出了一种基于关联规则挖掘的决策树构造方法。首先定义了高可信度的近似精确规则,给出了挖掘这类规则的算法;在近似精确规则的基础上产生新的属性,并讨论了新生成属性的评价方法;然后利用新生成的属性和数据本身的属性共同构造决策树;实验结果表明新的决策树构造方法具有较高的精度。
- 高静宋威杨炳儒徐章艳
- 关键词:关联规则决策树
- 利用数据挖掘方法分析客户忠诚度被引量:10
- 2005年
- 针对客户忠诚度分析这一客户关系管理系统的重要问题,在分析已有工作的基础上。经过多级数据归约,提出了多商品配送企业适合工程计算的客户忠诚度公式。进而对客户进行了高速聚类挖掘,找出了客户群的特点,对公司有针对性地制定客户策略起到了一定的指导作用。
- 李卫东张桂芸李欣杨炳儒
- 关键词:客户忠诚度客户策略商品配送客户关系管理系统数据归约
- 一种多标准决策树剪枝方法及其在入侵检测中的应用被引量:2
- 2007年
- 为提高决策树的适用性,以决策树在入侵检测中的应用为背景提出一种多标准的剪枝方法,使决策树程序能在参数调整后适应不同的应用.给出了用于描述决策树不同性能的一些参量,如稳定性、复杂度、分类能力等,用户可以根据具体情况对向量各分量的权重进行调整,逐步得到满足要求的决策树.实验结果表明,该算法能够根据入侵检测系统的具体需要,快速地构建相应的决策树,从而程序可被用于不同情况.该方法把由程序员决定决策树变成了由用户决定决策树,程序更通用,结果更合理.
- 李卫东宋威李欣杨炳儒
- 关键词:入侵检测决策树剪枝稳定性复杂度
- 面向语义的精简化多关系频繁模式发现方法被引量:2
- 2008年
- 多关系频繁模式发现能够直接从复杂结构化数据中发现涉及多个关系的复杂频繁模式,避免了传统方法的局限。有别于主流基于归纳逻辑程序设计技术的方法,提出了基于合取查询包含关系的面向语义的精简化多关系频繁模式发现方法,具有理论与技术基础的新颖性,解决了两种语义冗余问题。实验表明,该方法在可理解性、功能、效率以及可扩展性方面具有优势。
- 杨炳儒张伟钱榕
- 关键词:多关系数据挖掘
- 基于索引数组和复合频繁模式树的频繁闭项集挖掘算法被引量:1
- 2007年
- 频繁闭项集惟一确定频繁项集且规模小得多。CROP是一种基于复合频繁模式树的、频繁闭项集高效挖掘算法,但存在着候选结点过多的问题。这些非闭合结点的生成、检查和剪裁带来了大量不必要的操作。提出了一种改进的频繁闭项集挖掘算法CROP_Index。该算法用"索引数组"来组织数据,找到频繁共同出现的项集。基于二进制位图,给出了一个包含索引的计算方法,并利用索引启发信息合并,得到复合型频繁模式树的初始结点;同时给出一些新的性质,使得改进的算法只生成闭合结点,从而节省了大量不必要的操作,缩小了搜索空间。实验结果表明该算法效率较高。
- 宋威杨炳儒徐章艳张桃红
- 关键词:数据挖掘关联规则频繁闭项集索引数组
- 基于周期采样的数据流频繁项集挖掘算法研究
- 2009年
- 针对用于数据流频繁项集挖掘的现有方法存在引入过多次频繁项集以及时空性能与输出精度较低的问题,利用Chebyshev不等式,构造了项集频度周期采样的概率误差边界,给出了动态检测项集支持度变化方法。提出了一种基于周期采样的数据流频繁项集挖掘算法FI-PS,该算法通过跟踪项集支持度变化确定项集支持度的稳定性,并以此作为调整窗口大小以及采样周期的依据,从而以一个较大的概率保证项集支持度误差有上界。理论分析及实验证明该算法有效,在保证挖掘结果准确度相对较好的条件下,可获得较优执行性能。
- 侯伟杨炳儒吴晨生周谆
- 关键词:数据挖掘数据流
- 差别矩阵属性约简的信息观解释被引量:6
- 2007年
- 常见的属性约简定义有三种,即基于代数观的属性约简,基于信息观的属性约简和基于HU差别矩阵的属性约简。已有文献证明这三种属性约简彼此之间不等价。王国胤教授定义了一种新的决策表信息熵计算方法,在此方法基础上给出了粗糙集理论代数观的一种新的信息观解释。最近有学者提出了一种基于新信息熵的属性约简。经深入研究,我们证明了该属性约简与基于HU差别矩阵的属性约简是等价的,从而给出了基于HU差别矩阵的属性约简的信息观解释。
- 徐章艳杨炳儒宋威侯伟
- 关键词:正区域差别矩阵信息熵
- 一个基于正区域的快速求核算法被引量:17
- 2006年
- 现有利用差别矩阵设计的基于正区域的求核算法,其时间复杂度为O(|C‖U|2)。为降低求核算法的时间复杂度,给出了简化差别矩阵的定义和基于简化差别矩阵核的定义,并证明了该核与基于正区域的核是等价的。由于求简化差别矩阵的关键是求划分U/C,故利用基数排序的思想设计了一个快速求划分U/C的算法,其时间复杂度为O(|C‖U|)。在此基础上,利用简化差别矩阵设计了一个基于正区域的快速求核算法,其时间复杂度降为max{O(|C‖U|),O(|C‖U/C‖Up′os)}。实例说明了新算法的有效性。
- 徐章艳杨炳儒蔡卫东崔巍谷冬元
- 关键词:粗糙集正区域简化差别矩阵复杂度
- 基于主题的个性化元搜索引擎的设计与实现被引量:12
- 2005年
- 介绍了基于主题的个性化元搜索引擎的设计方法与实现技术,该系统可以让用户根据感兴趣的领域自行定制一个主题树,每个主题可以包括多个搜索策略,然后采用元搜索引擎技术使用户能够得到真正想要的信息。
- 王敏杨炳儒
- 关键词:主题树搜索引擎元搜索引擎个性化服务
- 平面点集凸壳的一种快速算法被引量:14
- 2006年
- 提出一种计算平面点集凸壳的快速算法———八方向极值快速凸壳算法。该算法首先对平面点集进行一次扫描,从而快速查找到东、南、西、北、东南、西南、东北、西北8个方向上的极值点,构造出一个更接近凸壳的初始凸壳,从而在后续的点集扫描中可以排除更多的内点,使该算法计算效率更高。该算法的空间复杂度为O(N);其时间复杂度虽然无法突破最坏情况下O(NlogN)的理论下限,但其期望时间复杂度已达到线性水平,并且可以容易地扩展到三维和高维空间。
- 樊广佺马丽平杨炳儒
- 关键词:JAVA凸壳