张伶卫
- 作品数:3 被引量:3H指数:1
- 供职机构:南京邮电大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 分布式环境下的隐私保护特征选择研究
- 2012年
- 在Map-Reduce的分布式环境框架下,基于微分隐私与主成分分析,并与熵、误分类增益、基尼指数等统计量相结合,提出了一种新的在分布式环境下的隐私保护特征选择算法,实现了在保护数据集隐私的同时保护特征的隐私.仿真实验结果表明,该算法具有较好的性能,能够在保护一定程度隐私信息的同时,有效地进行特征选择.
- 万文强张伶卫
- 关键词:隐私保护分布式主成分分析
- 基于云计算平台的代价敏感集成学习研究
- 现实生活中存在着很多不平衡类数据分类问题,同时计算机和互联网技术的快速发展,使得现实生活领域的数据膨胀速度异常迅猛,因而大数据时代的不平衡学习面临着更为严峻的挑战,如何快速高效地对海量不平衡数据进行分析处理,历来是数据挖...
- 张伶卫
- 关键词:数据挖掘云计算平台
- 文献传递
- 基于云计算平台的代价敏感集成学习算法研究被引量:3
- 2012年
- 针对现实生活中大规模不平衡数据的分类问题,设计了一种基于云计算平台的代价敏感集成学习分类算法。Hadoop云计算平台对海量数据进行划分用于并行学习,同时结合代价敏感的思想对学习得到的基分类器进行加权集成,实现了云计算平台上的代价敏感集成学习分类模型。仿真实验表明该模型能够明显提高少数类的查全率,同时Hadoop的并行机制使得云平台坏境下的集成学习时间较集中式环境有大幅度的缩减,进一步提高了大规模不平衡数据分类问题的学习效率。
- 张伶卫万文强
- 关键词:云计算平台分布式