黄秀霞
- 作品数:2 被引量:20H指数:2
- 供职机构:江南大学物联网工程学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于属性依赖度计算和PCA的C4.5算法被引量:5
- 2017年
- 针对C4.5算法繁多的对数运算、无关属性地干扰和属性相关性的影响等问题,提出了基于属性依赖度计算和主成分分析(PCA)的C4.5算法。根据等价无穷小的原理简化运算公式;用属性依赖度的计算并借鉴PCA算法的压缩原理来处理属性相关性问题;引入了"平均波动率"和"应用权重"两个新概念,得到一个新的属性选择度量。用学生综合成绩的评定工作进行应用分析,并用UCI数据集进行性能比较,实验表明:改进后算法的评定结果更科学,并且分类更准确,运算效率更高。
- 黄秀霞孙力
- 关键词:C4.5算法主成分分析
- C4.5算法的优化被引量:15
- 2016年
- 对传统C4.5算法的运算效率和属性选择准确性进行研究,对其进行改进。运用泰勒级数和等价无穷小的原理对算法的计算公式进行简化,提高运算效率;在简化后的信息增益率计算公式中引入其它非类属性对于该属性的GINI指数的均值,用于调整因非类属性间冗余度问题导致的误差,提高算法属性选择的准确性,将改进后的算法称为G_C4.5。对G_C4.5、传统C4.5算法与其它改进算法进行对比实验分析,分析结果表明,G_C4.5算法在分类效率和准确性上都有一定提高。
- 黄秀霞孙力
- 关键词:C4.5算法泰勒级数等价无穷小