何威
- 作品数:10 被引量:12H指数:3
- 供职机构:广西师范大学更多>>
- 发文基金:国家自然科学基金广西壮族自治区自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于图稀疏的自表达属性选择算法被引量:2
- 2016年
- 为解决高维数据属性维度高,不易直接应用的问题,提出通过属性自表达移除不相关和冗余属性的属性选择算法。基于稀疏学习的框架,通过属性自表达考虑属性间的相关性,利用子空间学习的局部保留投影(LPP)算法,确保属性选择时数据的局部结构保持不变。实验结果表明,该算法在UCI等数据集上优于4种对比算法。
- 钟智胡荣耀何威罗?
- 关键词:子空间学习属性约简
- 自表达属性选择研究
- 高维数据通常含有噪音以及冗余。特别是,数据的高属性维度不仅会增加储存空间,而且属性维数在达到某一临界值后,特定数据挖掘算法的性能反而下降,即所谓的“维度灾难”。另一方面,由于资源所限等原因数据的类标签在实际应用中很难获取...
- 何威
- 关键词:数据挖掘
- 基于属性自表达的低秩超图属性选择算法
- 2017年
- 针对高维数据具有低秩形式和属性冗余等特点,提出一种基于属性自表达的无监督超图属性选择算法。该算法首先利用属性自表达特点用其他属性稀疏地表达每个属性,此自表达形式使用低秩假设寻找高维数据的低秩表示,然后建立超图正则化因子保持高维数据的局部结构,最后利用稀疏正则化因子进行属性选择。属性自表达特性确定属性的重要性,低秩表示相当于考虑数据的全局信息进行子空间学习,超图正则化因子考虑数据的局部结构对数据进行子空间学习。该算法实际上考虑数据全局和局部信息进行子空间学习,更是一种嵌入了子空间学习的属性选择算法。实验结果表明,该算法相比其他对比算法,能更有效地选取属性,并能取得很好的分类效果。
- 苏毅娟雷聪胡荣耀何威朱永华
- 关键词:子空间学习超图
- 基于稀疏学习的低秩属性选择算法被引量:2
- 2017年
- 针对回归模型在进行属性选择未考虑类标签之间关系从而导致回归效果不理想,提出了一种新的具有鲁棒性的低秩属性选择算法。具体为,在线性回归的模型框架下,通过低秩约束来考虑类标签间的相关性和通过稀疏学习理论中的l_(2,p)-范数来考虑属性间的关联结构,以此去除不相关的冗余属性的影响;算法通过嵌入子空间学习方法(线性判别分析(LDA))来调整属性选择结果。经实验验证,提出的属性选择算法在六个公开数据集上的效果均优于四种对比算法。
- 胡荣耀刘星毅程德波何威
- 关键词:线性判别分析子空间学习
- 基于图的特征选择算法在阿兹海默症诊断问题研究被引量:3
- 2017年
- 针对神经性疾病难以确诊的问题,提出了一种基于图的特征选择方法,过滤掉不相干的特征,从而方便并且准确地对疾病患者进行诊断。算法首先基于先验知识定义了两种基本关系(特征关系和样本关系);然后将这两种关系嵌入到一个由最小二次损失函数和l2-范数正则化因子组成的多任务学习框架中进行特征选择;最后,将约简得到的降维矩阵送入支持向量机(SVM)中对阿兹海默症患者进行确诊。通过对Alzheimer’s disease neuroimaging initiative(ANDI)的研究数据集进行实验得知,提出算法的分类效果均优于一般常用分类算法,如K最近邻法(KNN)、支持向量机(SVM)等。提出的算法通过考虑特征选择和引入两种数据的内在关系,有效提高了阿兹海默疾病诊断的正确率。
- 朱永华程德波何威文国秋梁正友
- 基于稀疏学习的鲁棒自表达属性选择算法
- 2016年
- 受属性选择处理高维数据表现的高效性和低秩自表达方法在子空间聚类上成功运用的启发,提出一种基于稀疏学习的自表达属性选择算法。算法首先将每个属性用其他属性线性表示得到自表达系数矩阵;然后结合稀疏学习的理论(即整合L2,1-范数为稀疏正则化项惩罚目标函数)实现属性选择。在以分类准确率和方差作为评价指标下,相比其他算法,实验结果表明该算法可更高效地选择出重要属性,且显示出非常好的鲁棒性。
- 何威刘星毅程德波胡荣耀
- 关键词:高维数据
- 基于超图和样本自表征的谱聚类算法被引量:2
- 2017年
- 针对传统谱聚类算法仅考虑数据点对点间的相互关系而未考虑数据间可能隐藏的复杂的相关性的问题,提出一种基于超图和自表征的谱聚类方法。首先,建立数据的超图,得到超图的拉普拉斯矩阵表示;然后利用l_(2,1)-范数对样本进行行稀疏自表征,同时融入超图来描述数据间多层次的相互关系;最后,利用生成的自表征系数进行谱聚类。利用基于超图的样本自表征技术考虑了样本之间复杂的相关性。通过在Hopkins155等数据集上的实验表明,在聚类错误率评判标准下,算法优于现有基于普通图的谱聚类算法SSC、SRC等。
- 李永钢苏毅娟何威雷聪
- 关键词:谱聚类超图
- 鲁棒自表达的低秩属性选择算法被引量:3
- 2017年
- 针对无监督属性选择算法无类别信息和未考虑属性的低秩问题,提出一种基于自表达方法的低秩属性选择算法。在损失函数中使用低秩和自表达方法描述属性间的相关结构,利用K均值聚类算法得到所有样本的伪类标签进行属性选择,采用稀疏学习方法中的l_(2,p)-范数参数p控制属性选择结果的稀疏性,并通过子空间学习方法使属性选择结果达到全局最优。实验结果表明,与无监督属性选择算法相比,该算法在6个公开数据集上均具有较高的分类准确率及稳定性。
- 胡荣耀刘星毅程德波何威罗噭
- 关键词:子空间学习K均值聚类
- 属性自表达的低秩无监督属性选择算法
- 2018年
- 针对现有无监督属性约简方法只单一使用子空间学习或属性选择的方法,并且忽略数据之间的内在相关性,本文提出一种新的属性选择方法。首先提出一个属性自表达损失函数加上一个稀疏正则化(l2,1-范数)实现无监督学习与属性选择。然后嵌入子空间学习方法,并使用低秩约束和图正则化项考虑数据的全局结构和局部结构。经聚类实验验证,该算法较对比算法能取得更好的效果。
- 郑威文国秋何威胡荣耀赵树之
- 关键词:子空间学习属性约简
- 基于子空间学习的图稀疏属性选择算法被引量:3
- 2016年
- 针对处理高维度属性的大数据属性约减方法进行了研究,发现属性选择和子空间学习是属性约简的两种常见方法,其中属性选择具有很好的解释性,子空间学习的分类效果优于属性选择,而往往这两种方法是各自独立进行应用的。为此,综合这两种属性约简方法,设计出新的属性选择方法,即利用子空间学习的两种技术(即线性判别分析(LDA)和局部保持投影(LPP)),考虑数据的全局特性和局部特性,同时设置稀疏正则化因子实现属性选择。基于分类准确率、方差和变异系数等评价指标的实验结果表明,该算法相比其他算法,能更有效地选取判别属性,并能取得很好的分类效果。
- 钟智何威程德波胡荣耀刘星毅
- 关键词:属性约简子空间学习线性判别分析局部保持投影