国家自然科学基金(61070031)
- 作品数:3 被引量:2H指数:1
- 相关作者:乐嘉锦陈德华王梅陆戌辰骆永成更多>>
- 相关机构:东华大学更多>>
- 发文基金:国家自然科学基金上海市自然科学基金国家科技重大专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向个体和敏感属性值的匿名数据发布
- 2012年
- 针对目前数据发布方法不能有效处理不同个体隐私保护需求的问题,依据个体隐私自治的原则,从面向个体和敏感属性值角度,提出一个敏感数据发布的个性化匿名发布模型和基于泛化技术的启发式算法。通过Adult数据实验,验证了算法的可行性。与Basic Incognito和Mondrian相比,信息损失少,算法性能良好。
- 骆永成乐嘉锦陈德华
- 关键词:数据发布个性化泛化
- APWAH:一种自适应划分字对齐的混合位向量压缩技术
- 在对海量数据的查询执行中,高效地存储中间结果是提高查询效率的重要手段之一.现有的列存储系统大都主要关注于如何选择合理的物化时机来提高查询效率,而忽略了对中间结果的有效管理.首先,为了减小查询执行过程中中间结果的大小,提出...
- 丁祥武李清炳王梅
- 关键词:位运算
- 文献传递
- 列存储系统面向列的连接顺序优化研究被引量:1
- 2013年
- 连接操作是影响列存储数据查询效率的重要操作之一.对于列存储系统中的连接操作优化,以往的研究工作大多专注于对数据组织结构的优化以及辅助物理结构的建立上,极少涉及逻辑层特别是早期的连接策略优化.为此,根据列存储数据的特点和分析型查询需求的特征,提出了一种新的列存储连接优化方法.该方法采用提早优化的策略,使用"事实表下推"的优化规则,并在多事实表查询条件下引入浓密树进行连接顺序决策,以较小的时空复杂度获得"最优"的连接执行顺序.使用代价估计模型对提出的连接策略优化方法进行了理论验证.同时,在大规模数据仓库基准数据集SSB上通过实验验证了提早优化机制及下推规则的有效性.
- 王梅陆戌辰乐嘉锦
- 关键词:数据库查询优化
- 面向大规模图数据的分布式并行聚类算法研究
- 图聚类作为一种重要的图数据挖掘技术,在许多实际应用中已得到广泛的关注.针对图数据日益普及、规模不断增大的现实,提出了一种高效的分布式并行图聚类算法,即MR-LSH算法.该算法是在MapReduce框架的基础上,通过对传统...
- 陈德华解维李悦
- 关键词:MAPREDUCE框架集群环境
- 文献传递
- 列存储数据仓库中Hash连接改进算法研究
- Hash连接是一种高效的连接算法.然而由于难以提前选择合适的桶数和散列函数,降低了Hash连接效率.该问题在列存储海量数据查询连接中,表现尤为明显.提出了一种基于桶内索引的Hash连接改进算法.该算法当某些桶内出现数据大...
- 孙莉郝大腾王梅
- 关键词:索引数据仓库
- 文献传递
- 公交信息服务系统设计与实现被引量:1
- 2013年
- 结合智能公共交通系统的应用现状,设计公交信息服务系统中的路网以及线网模型,并给出公交换乘的设计思路,最后以"基于GIS的浦东新区公交服务市民互动信息系统"为应用实例,详细阐述了公交信息服务系统的设计方案。
- 孙延青陈民陈德华
- 关键词:智能公交GIS公交换乘信息服务
- 一种基于局部位置无关的轨迹片段聚类算法
- 随着定位技术在很多领域的应用,越来越多的应用系统服务器中开始存储大量的定位数据,而如何对这些定位数据进行聚类分析日益成为一个研究热点.针对以轨迹片段表示轨迹局部特征存在的问题,引入了以轨迹点表示轨迹局部特征的思想,并在局...
- 张莎妮刘良旭叶思敏范剑波
- 文献传递