国家自然科学基金(61202311)
- 作品数:21 被引量:62H指数:5
- 相关作者:刘忠宝赵文娟钱鹏江王士同蒋亦樟更多>>
- 相关机构:中北大学江南大学山西大学更多>>
- 发文基金:国家自然科学基金江苏省自然科学基金山西省高等学校科技创新项目更多>>
- 相关领域:自动化与计算机技术理学一般工业技术文化科学更多>>
- 具备迁移能力的类中心距离极大化聚类算法被引量:3
- 2016年
- 传统的聚类算法在以下两种情况下存在直接失效的风险:一是数据稀少或存在大量干扰数据;二是为了调控数据间的差异性,对数据集进行缩放。为了同时解决上述两个问题,提出了历史知识迁移准则与中心间距极大化准则,并将其运用到极大熵聚类算法中,称之为具备历史迁移能力的中心极大化聚类算法。算法有三大突出的优点:在当前数据稀少或存在污染时,算法有效利用了历史知识进行迁移学习,从而证明了较好的聚类有效性;在数据缩放到一定倍数时,传统聚类算法取得的类中心趋于一致,而算法利用类中心间距极大化准则,有效避免了类中心一致的问题;算法所利用的历史知识均不暴露历史源数据,因此算法具有良好的历史数据隐私保护效果。通过模拟数据集和真实数据集的实验,验证了算法的上述优点。
- 孙寿伟钱鹏江陈爱国蒋亦樟
- 关键词:历史知识隐私保护模糊聚类
- 基于分类超平面的非线性集成学习机被引量:2
- 2013年
- 针对支持向量机面临的大规模数据分类问题,提出基于分类超平面的非线性集成学习机NALM。该方法借鉴管理学中协同管理的思想,将大规模数据分成规模较小的子集,然后分别在子集上运行分类超平面算法,最后将各子集上的分类结果进行非线性集成得到最终的分类结果。该方法不仅继承了分类超平面的优点,而且还将分类超平面的适用范围从小规模数据扩展到中大规模数据,从线性空间推广到Hilbert核空间。若干数据集上的实验表明:NALM能以较少的支持向量来解决大规模样本分类问题。
- 刘忠宝赵文娟师智斌
- 关键词:支持向量机分类超平面大规模数据
- 基于最小流形类内离散度的支持向量机被引量:3
- 2015年
- 尽管经典分类方法支持向量机SVM在各领域广泛应用,但其在分类决策时仅关注类间间隔而忽视类内分布,因而分类能力有限。鉴于此,Zafeiriou等人提出最小类方差支持向量机MCVSVM,该方法建立在支持向量机和线性判别分析的基础上,在进行分类决策时同时考虑各类的边界信息和分布特征,因而较之SVM具有更优的泛化能力。但上述两种方法均忽略了样本的局部特征。基于上述分析,在流形判别分析的基础上提出基于最小流形类内离散度的支持向量机SVM-M2WCS。该方法在建立最优分类面时,不仅考虑各类的边界信息和分布特征,而且还保持了各类的局部流形结构。经理论分析可得该方法在一定条件下与SVM和MCVSVM等价,这表明SVM-M2WCS较之SVM和MCVSVM具有更优的泛化能力。人工数据集及标准数据集上的比较实验表明SVM-M2WCS的有效性。
- 高艳云庞敏
- 关键词:支持向量机边界信息局部信息
- 基于最大散度差的保序分类算法
- 2017年
- 分类算法主要存在问题:(1)无法充分利用样本的分布特征;(2)无法保持样本的相对关系不变;(3)无法解决大规模分类问题。对此,提出了一种基于最大散度差的保序分类算法RPCM,该方法利用线性判别分析算法中的类间离散度和类内离散度来表征样本的分布特征,通过保持各类样本中心相对关系不变来实现样本相对关系不变。理论分析表明:RPCM的对偶形式与最小包含球等价。在核心向量机的基础上提出了RPCM-CVM算法,该算法可用来解决大规模分类问题,标准数据集上的比较实验验证了所提方法的有效性。
- 郝伟刘忠宝
- 关键词:最大散度差类内离散度
- 新型支持向量机在风速预测模型中的应用研究被引量:5
- 2014年
- 在短期风速预测方面支持向量机已被广泛应用并取得较好的效果。然而,随着应用的深入,其逐渐暴露出两大问题:一,对噪声较为敏感;二,未能充分利用样本已有信息。为进一步提高支持向量机的泛化能力,该文提出模糊流形支持向量机FMSVM。该方法引入模糊技术,保证不同样本区别对待,减少或消除噪声的影响;充分利用流形判别分析的性质,进一步改进支持向量机,在分类决策时同时考虑样本的边界信息、分布特征以及局部流形结构。通过某风场风速数据集上的比较实验验证该方法的有效性。
- 刘忠宝
- 关键词:支持向量机风速预测
- 基于流形判别分析的全局保序学习机
- 2015年
- 当前主流分类方法在分类决策时无法同时考虑样本的全局特征和局部特征,而且大多算法仅关注各类样本的可分性,往往忽略样本之间的相对关系。为了解决上述问题,提出了基于流形判别分析的全局保序学习机。该方法引入流形判别分析来反映样本的全局特征和局部特征;通过保持各类样本中心的相对关系不变进而实现保持全体样本的先后顺序不变;借鉴核心向量机有关理论和方法,通过建立所提方法与核心向量机对偶形式的等价关系实现大规模分类。人工数据集和标准数据集上的比较实验验证了该方法的有效性。
- 张静刘忠宝
- 关键词:支持向量机
- 一种基于同类约束的半监督近邻反射传播聚类方法被引量:11
- 2016年
- 以近邻反射传播(Affinity propagation,AP)聚类算法为基础,提出了一种基于同类约束的半监督近邻反射传播聚类方法 (Semi-supervised affinity propagation clustering method with homogeneity constraints,HCSAP).该方法在聚类目标函数中引入同类约束项,以保证聚类结果与同类集先验信息一致.利用最大和信任传播(Max-sum belief propagation)优化过程对目标函数进行求解,导出同类约束下的吸引度(Responsibility)和归属度(Availability)的迭代方程.人工数据集和真实数据集上的实验结果表明本文所提方法的有效性.
- 徐明亮王士同杭文龙
- 关键词:半监督聚类信任传播
- 流形判别分析被引量:13
- 2013年
- 传统降维方法主要有两种思路:一是利用样本的全局特征,保证降维前后样本的全局特征不变;二是尽量保证相邻样本在降维前后的相对关系不变。传统方法由于未能充分利用样本的已有信息,因此降维效率有限。鉴于此,在Fisher准则和局部流形保持的基础上,该文提出流形判别分析。该方法首先定义了基于流形的类内离散度MWCS和类间离散度MBCS,然后利用Fisher准则找到最佳投影方向,该方向满足MBCS与MWCS之比最大。该方法不仅继承了传统降维方法的优势,而且进一步提高了降维效率。标准数据集上的实验结果表明该文所提方法的有效性。
- 刘忠宝潘广贞赵文娟
- 关键词:模式识别流形学习降维FISHER准则
- 知识迁移极大熵聚类算法被引量:6
- 2015年
- 为解决数据不足或失真等环境下传统聚类技术效果不佳的问题,基于历史类中心和历史隶属度提出两种知识迁移机制,并与极大熵聚类方法融合提出知识迁移极大熵聚类算法KT-MEC.KT-MEC的优点是:利用历史知识,KT-MEC聚类有效性和实用性明显增强;内嵌迁移机制均不暴露源域数据,从而拥有源域隐私保护能力;KT-MEC基于的"参数寻优+聚类有效性度量"机制理论上保证其性能不差于经典极大熵算法,避免了负迁移问题.
- 钱鹏江孙寿伟蒋亦樟王士同邓赵红
- 关键词:知识迁移隐私保护负迁移
- 具备历史借鉴能力的软划分聚类模型
- 2015年
- 在数据稀少或失真等场景下,传统软划分聚类算法无法获得满意的聚类效果。为解决该问题,以极大熵聚类算法为基础,基于历史知识利用的途径,提出两种新的具备历史借鉴能力的软划分聚类模型(分别简称SPBCRHK-1和SPBC-RHK-2)。SPBC-RHK-1是仅借鉴历史类中心的基础模型,SPBC-RHK-2则是以历史类中心和历史隶属度相融合为手段的高级模型。通过历史知识借鉴,两种模型的聚类有效性均得到有效提高,比较而言具备更高知识利用能力的SPBC-RHK-2模型在聚类有效性和鲁棒性上具有更好的表现。由于所用历史知识不暴露历史源数据,因此两种方法还具有良好的历史数据隐私保护效果。最后在模拟数据集和真实数据集上的实验验证了上述优点。
- 孙寿伟钱鹏江陈爱国蒋亦樟
- 关键词:历史知识知识利用