中国博士后科学基金(2013M530072)
- 作品数:3 被引量:15H指数:2
- 相关作者:刘华文李玲赵建民马宗杰徐晓丹更多>>
- 相关机构:浙江师范大学中国科学院数学与系统科学研究院更多>>
- 发文基金:中国博士后科学基金模式识别国家重点实验室开放课题基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于信息增益的多标签特征选择算法被引量:9
- 2015年
- 多标签特征选择是一种提高多标签分类器性能的技术。针对目前这类技术在给出合理特征子集合时无法同时兼顾计算复杂度和标签间的相关性的问题,提出一种基于信息增益的多标签分类算法。该算法假设特征之间相互独立,首先使用单个特征与整个标签集合之间的信息增益来度量这两者的关联程度,再根据阈值删除不相关的特征以得到最优特征子集合。实验表明,该算法能有效地提高多标签分类器的分类性能。
- 李玲刘华文徐晓丹赵建民
- 关键词:数据挖掘信息增益
- 基于特征选择的集成多标签分类算法被引量:1
- 2013年
- 与传统分类方法相似,多标签学习同样面临着因数据高维引起的问题,如过拟合和维灾难等。虽然目前已经提出了一些多标签分类算法,但多标签数据的高维性问题并未得到普遍重视。针对这个问题,利用条件互信息度量特征与类别标签之间的相关性,依此实施特征选择操作,以发现重要特征。在此基础上,提出了一种新的多标签集成分类算法。模拟实验结果表明,与经典分类算法相比,本文提出的集成算法在大多数情况下取得了较优的分类效果。
- 李玲刘华文马宗杰赵建民
- 关键词:数据挖掘条件互信息
- 基于奇异值分解—偏最小二乘回归的多标签分类算法被引量:5
- 2014年
- 针对多标签数据的标签相关性和高维问题,提出一种基于奇异值分解—偏最小二乘回归的多标签分类算法,该算法可以对多标签数据进行维数约简和回归分析。首先,将类别标签集合作为整体处理,对标签相关性进行考察;其次,利用奇异值分解(SVD)技术得到样本和标签空间的得分向量,实施降维;最后,在偏最小二乘回归(PLSR)的基础上构建多标签分类模型。实验结果表明,在四种维数较高的真实数据集上,该算法可以获得有效的分类结果。
- 马宗杰刘华文
- 关键词:奇异值分解偏最小二乘回归维数约简