郝思媛 作品数:8 被引量:125 H指数:4 供职机构: 哈尔滨工程大学信息与通信工程学院 更多>> 发文基金: 国家自然科学基金 国家教育部博士点基金 中国博士后科学基金 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
基于谱聚类欠取样的不均衡数据SVM分类算法 被引量:28 2012年 提出一种基于谱聚类欠取样的不均衡数据支持向量机(SVM)分类算法.该算法首先在核空间中对多数类样本进行谱聚类;然后在每个聚类中根据聚类大小和该聚类与少数类样本间的距离,选择具有代表意义的信息点;最终实现训练样本间的数目均衡.实验中将该算法同其他不均衡数据预处理方法相比较,结果表明该算法不仅能有效提高SVM算法对少数类的分类性能,而且总体分类性能及运行效率都有明显提高. 陶新民 张冬雪 郝思媛 付丹丹关键词:不均衡数据 SVM算法 谱聚类 不均衡数据分类算法的综述 被引量:66 2013年 传统的分类方法都是建立在类分布大致平衡这一假设基础上的,然而实际情况中,数据往往都是不均衡的。因此,传统分类器分类性能通常比较有限。从数据层面和算法层面对国内外分类算法做了详细而系统的概述。并通过仿真实验,比较了多种不平衡分类算法在6个不同数据集上的分类性能,发现改进的分类算法在整体性能上得到不同程度的提高,最后列出了不均衡数据分类发展还需解决的一些问题。 陶新民 郝思媛 张冬雪 徐鹏关键词:不均衡数据 基于谱聚类下采样失衡数据下SVM故障检测 被引量:3 2013年 在故障诊断领域中,对传统支持向量机(SVM)算法在数据失衡情况下无法有效实现故障检测的不足,提出一种基于谱聚类下采样失衡数据下SVM故障检测算法。该算法在核空间中对多数类进行谱聚类,然后选择具有代表意义的信息点,最终实现样本均衡。将该算法应用在轴承故障检测领域,并同其他算法进行比较,试验结果表明所建议的算法在失衡数据情况下较其他算法具有较强的故障检测性能。 陶新民 张冬雪 郝思媛 徐鹏关键词:故障检测 谱聚类 下采样 核聚类集成失衡数据SVM算法 被引量:5 2013年 针对传统SVM算法在失衡数据集下的分类性能不理想的问题,提出一种基于核聚类集成SVM算法.该算法首先在核空间中对多数类样本集进行聚类,然后随机选择出具有代表意义的聚类信息点,实现在减少多数类样本数的同时将分类界面向多数类样本方向偏移.并利用AdaBoost集成手段对基于核聚类的欠取样SVM算法进行集成,最终提高SVM算法在失衡数据下的泛化性能.将提出的算法同其他失衡数据预处理集成方法进行比较,实验结果表明该算法能够有效提高SVM算法在失衡数据中少数类的分类性能,且总体分类性能及运行效率都有明显提高. 陶新民 郝思媛 张冬雪 徐鹏关键词:SVM算法 ADABOOST 核聚类 基于K均值的带变异粒子群聚类算法 被引量:1 2011年 针对K均值算法的搜索结果依赖于初始聚类中心以及粒子群算法早熟收敛的缺点,提出了一种基于K均值的带变异粒子群聚类算法.该算法通过粒子群算法来弥补K均值算法的不足,根据粒子的收敛情况判断K均值操作的时机,提高了搜索性能,并采用变异操作来跳出局部极值.分别用K均值算法、PSO-K均值算法和该算法对3种实际数据进行了聚类测试,实验结果的比较表明,该算法可以跳出局部极值,找到比其他2种算法更好的解,有更好的寻优效率并且更加稳定. 陶新民 徐鹏 张冬雪 郝思媛关键词:聚类分析 K均值算法 粒子群优化算法 群体智能 基于样本特性欠取样的不均衡支持向量机 被引量:25 2013年 针对传统支持向量机在数据失衡的情况下分类效果很不理想的问题,提出一种基于样本特性欠取样的不均衡SVM分类算法.该算法首先在核空间中依据样本信息量选择一定比例的靠近不均衡分类界面的多数类样本;然后根据样本密度信息选择最具有代表性的均衡多数类样本点,在减少多数类样本的同时使分类界面向多数类方向偏移.实验结果表明,所提出的算法与其他不均衡数据预处理方法相比,能有效提高SVM算法在失衡数据中少数类的分类性能、总体分类性能和鲁棒性. 陶新民 郝思媛 张冬雪 李震关键词:不均衡数据 支持向量机 LSTSVM的样本缩减与空间信息融合方法 被引量:2 2015年 针对最小二乘孪生支持向量机(STSVM,least squares twin support vector machines)分类效率低的不足,在一对余(1-a-r)多分类器的基础上,提出一种基于样本缩减(SR)的LSTSVM(SRLSTSVM)分类算法。在核空间中通过距离计算,选出对分类超平面起决定作用的样本点,用于分类器的训练;与此同时,为了充分利用高光谱遥感图像的空间信息,通过主成分分析(PCA)和二维Gabor滤波获取像元的纹理特征,将高光谱遥感图像的空间信息和光谱信息在图像层进行融合用于分类。实验证明,本文提出的SR算法可以在不影响分类精度的基础上大大提高LSTSVM的分类效率,且结合空间信息后的LSTSVM的总体分类精度也有明显提高。 王立国 路婷婷 宛宇美 郝思媛关键词:高光谱遥感图像 GABOR滤波 引入负相似的高光谱图像半监督分类 被引量:2 2015年 高光谱图像数据体现为波段多、地物标签获取困难大、谱信息抗干扰能力弱等特征,容易引起维数灾难、光谱空间变异性等问题,从而影响分类器的分类精度。针对这些问题,本文将负相似信息引入到拉普拉斯支持向量机(Laplacian Support Vector Machine,Lap SVM)的流形正则化项中,提出了一种引入负相似的拉普拉斯支持向量机(Dissimilarity in Laplacian Support Vector Machine,Diss-Lap SVM)分类算法,抑制光谱空间变异对分类结果的影响。同时,本文提出利用线性近邻传播(Linear Neighborhood Propagation,LNP)算法构造图的拉普拉斯矩阵,更有效地引入无标签样本的信息。实验结果表明,本文算法的分类精度得到了提高,特别是对光谱特征相似的地物。 王立国 王雪君 郝思媛关键词:高光谱图像 半监督分类