国家自然科学基金(60403041)
- 作品数:6 被引量:61H指数:3
- 相关作者:唐世渭童云海谭少华王宏鼎杨冬青更多>>
- 相关机构:北京大学中国电信股份有限公司北京研究院中国联合通信有限公司更多>>
- 发文基金:国家自然科学基金国家科技重大专项中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术更多>>
- 分组随机化隐私保护频繁模式挖掘被引量:2
- 2021年
- 已有的隐私保护频繁模式挖掘随机化方法不考虑隐私保护需求差异性,对所有个体运用统一的随机化参数,实施同等的保护,无法满足个体对隐私的偏好.提出基于分组随机化的隐私保护频繁模式挖掘方法(grouping-based randomization for privacy preserving frequent pattern mining,简称GR-PPFM).该方法根据不同个体的隐私保护要求进行分组,为每一组数据设置不同的隐私保护级别和与之相适应的随机化参数.在合成数据和真实数据中的实验结果表明:相对于统一单参数随机化mask,分组多参数随机化GR-PPFM不仅能够满足不同群体多样化的隐私保护需求,还能在整体隐私保护度相同情况下提高挖掘结果的准确性.
- 郭宇红童云海苏燕青
- 关键词:随机化个性化隐私保护频繁模式挖掘
- 一种实现OLAP数据隐私保护的方法
- 2008年
- 提出一种对于联机分析处理(OLAP)数据的隐私保护方法。首先采用多项式回归的方法对查询数据进行初步模拟,在初步模拟基础上提出了两类有效的规则进行优化处理。该方法在隐私保护的同时保持了较好的信息有效性。同时利用Kullback-Leibler信息量来描述OLAP模拟数据的信息有效性,解决了有效性难以评价的问题。实验表明该方法在隐私保护和信息有效性两个方面均取得了满意的结果。
- 陶有东童云海谭少华唐世渭杨冬青
- 关键词:隐私保护联机分析处理
- 基于多策略学习的模式分类方法被引量:1
- 2005年
- 模式分类在数据集成和信息检索领域中有着广泛的应用需求。该文介绍了一种基于多策略学习的模式分类方法,实验表明它有效地提高了模式分类的准确率,同时易于扩展。
- 于波胡煜谭少华童云海唐世渭
- 关键词:多策略学习数据集成
- 朴素贝叶斯分类中的隐私保护方法研究被引量:22
- 2007年
- 数据挖掘中的隐私保护方法,试图在不精确访问原始数据详细信息的条件下,挖掘出准确的模式与规则.围绕着分类挖掘中的隐私保护问题展开研究,给出了一种基于数据处理和特征重构的朴素贝叶斯分类中的隐私保护方法.分别提出了一种针对枚举类型的隐私数据处理与特征重构方法——扩展的部分隐藏随机化回答(Extended Randomized Response with Partial Hiding,ERRPH)方法和一种针对数值类型的隐私数据处理与特征重构方法——转换的随机化回答(Transforming Randomized Response,TRR)方法,并在此基础上实现了一个完整的隐私保护的朴素贝叶斯分类算法.理论分析和实验结果均表明:朴素贝叶斯分类中基于ERRPH和TRR的隐私保护方法具有很好的隐私性、准确性、高效性和适用性.
- 张鹏唐世渭
- 关键词:数据挖掘隐私保护朴素贝叶斯分类
- 异常点挖掘研究进展被引量:32
- 2006年
- 异常点是数据集中与其他数据显著不同的数据.一个人的噪声对另一个人而言可能是有用的数据,因此,随着人们对数据质量、欺诈检测、网络入侵、故障诊断、自动军事侦察等问题的关注,异常点挖掘在信息科学研究领域日益受到重视.在充分调研国内外异常点挖掘研究文献基础上,系统地综述了数据库研究领域中异常点挖掘的研究现状,对已有各种异常点挖掘方法进行了总结和比较,并结合当前研究热点,展望了异常点挖掘未来的研究方向及其面临的挑战.
- 王宏鼎童云海谭少华唐世渭杨冬青
- 关键词:异常点数据流高维数据
- 基于模式元素语义关系的模式合并方法研究被引量:4
- 2007年
- 数据集成问题一直是数据库研究领域的热点之一,而全局模式构建是数据集成中的一项重要任务。通过对模式元素之间语义关系的分析,从数据源系统数据字典入手,利用模式匹配结果,提出了一种基于模式元素语义关系进行模式合并的方法,并给出了基于模式元素语义关系的合并规则及合并算法。最后,通过对已有模式合并方法的比较分析,说明该模式合并方法的可用性和有效性更好。
- 王宏鼎谭少华唐世渭杨冬青童云海
- 关键词:语义关系