李长生
- 作品数:5 被引量:79H指数:5
- 供职机构:兰州交通大学电子与信息工程学院更多>>
- 发文基金:国家自然科学基金甘肃省自然科学基金兰州市科技发展计划项目更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- 一种结合随机森林和邻域粗糙集的特征选择方法被引量:10
- 2017年
- 针对肿瘤基因数据具有高维小样本的特性,为了提高传统基因分类方法的正确率,提出一种结合随机森林和邻域粗糙集的特征基因选择方法(Random Forest and Neighborhood Rough Set,RFNRS).该方法首先利用Relief算法,对原始的肿瘤基因数据进行权重选择,去除权重较低的特征子集;接着引入基于随机森林的封装式特征选择算法(Random Forest Wrapper Feature Select,RFWFS),以模型准确率作为评判准则,筛选特征子集;然后引入邻域粗糙集针对连续性的特征子集进行寻优处理;最后利用多个经典分类算法处理特征子集.经实验结果表明,该方法不仅在肿瘤基因特征子集的选择上具有良好的性能,同时在算法的分类性能上也有所提高.
- 吴辰文王伟李长生梁靖涵闫光辉
- 关键词:RELIEF算法邻域粗糙集
- 信息熵特征加权核函数的SVM数据分类方法被引量:9
- 2017年
- 核函数及其参数的选择和优化与所分析数据的分布情况密切相关,同一数据经不同核函数映射或者同一核函数映射数据的不同特征子集都会获得不同的数据类群分度.现针对单一核函数在同一数据的不同特征子集上具有不同的预测识别效果的问题,结合信息熵理论,提出一种基于信息熵特征加权核函数的SVM数据分类方法,以避免核函数设计的盲目性及局部最优等非线性优化问题的同时提高算法的分类精度.经实验验证,基于信息熵特征加权核函数的SVM算法的识别结果与同类判别算法的识别结果相比,其分类准确率较高,稳定性和泛化性相对更好.
- 李长生吴辰文梁靖涵王伟
- 关键词:核函数信息熵特征加权
- 一种改进的SVM算法在乳腺癌诊断方面的应用被引量:15
- 2017年
- 针对计算机辅助诊断(CAD)技术在乳腺癌疾病诊断准确率的优化问题,提出了一种基于随机森林模型下Gini指标特征加权的支持向量机方法(RFG-SVM)。该方法利用了随机森林模型下的Gini指数衡量各个特征对分类结果的重要性,构造具有加权特征向量核函数的支持向量机,并在乳腺癌疾病诊断方面加以应用。经理论分析和实验数据验证,相比于传统的支持向量机(SVM),该方法提升了分类预测的性能,其结果与最新的方法相比也具有一定的竞争力,而且在医疗诊断应用方面更具优势。
- 吴辰文李长生王伟梁靖涵闫光辉
- 关键词:支持向量机特征加权计算机辅助诊断
- 基于递归特征消除方法的随机森林算法被引量:39
- 2017年
- 基于随机森林算法中的相关预测因子进行变量选择,在高维回归或分类框架中,变量选择是一项艰巨的任务,甚至在高度相关的预测中变得更加具有挑战性,文章提供了在回归模型上置换重要性测量的理论研究,这使我们能够描述相关性预测和排名的重要性之间的影响。相比于原始随机森林算法使用重要性排名做变量选择,研究结果使用了递归特征消除(RFE)方法做变量选择。通过实验证明了RFE-RF方法对机器学习算法的正确预测有很大的帮助。
- 吴辰文梁靖涵王伟李长生
- 关键词:递归
- 一种顺序响应的随机森林:变量预测和选择被引量:6
- 2017年
- 利用随机森林法(RF)进行分类和回归,在过去被广泛地研究,然而在基于顺序响应的情况下并没有标准的方法.在随机森林(RF)的基础上通过广泛的研究,对条件推理树进行探索,以探讨结合顺序信息是否改善预测性能或提高变量选择的效果.本文提出的两种置换变量的重要性预测方法 RPS-VIM和MAE-VIM经过实验验证是优化的方法,它替代目前存在的内置变量重要性测量方法 ER-VIM和MSE-VIM.基于真实数据的结果表明在某些设置中,有序回归树中使用RPS-VIM和MAEVIM顺序响应的组合,预测的排名可以得到改善,并且预测精度优于原始的基于分类树的随机森林.
- 吴辰文梁靖涵王伟李长生