赵杠
- 作品数:3 被引量:18H指数:2
- 供职机构:复旦大学更多>>
- 发文基金:国家重点基础研究发展计划国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 对偶连接问题的哈希算法研究
- 在信息检索和数据库应用中,一种常见的查询方式是从一组数据对象(如文档,图像)中返回符合条件的成对对象,例如,在数据库应用中经常需要根据相似度将两个相似的文档或者网页作为结果返回给用户,这样的操作在最近的研究工作中定义为相...
- 赵杠
- 一种并行处理Skyline查询的有效方法被引量:2
- 2010年
- Skyline查询是近年来数据库领域的一个研究重点和热点,这主要是因为Skyline查询在许多领域有着广泛的应用.现有的工作大都集中于单处理机环境,然而,由于Skyline查询是CPU敏感的,因此,在实际应用中,现有的方法具有很大的局限性.基于此,提出一种有效降低处理Skyline查询时间开销的并行算法PAPSQ(Parallel algorithm for processing skyline queries).算法有机结合多维数据对象的自身特性和通用多处理机系统的实施优点,以Skyline查询搜索偏序格为底层结构,利用多维数据对象的同胚评估值和偏序格加权技术来有效提高并行处理Skyline查询的效率.实验评估表明,PAPSQ算法具有有效性和实用性.
- 黄震华向阳薛永生赵杠
- 关键词:SKYLINE查询并行处理查询优化
- 基于概率数据流的有效聚类算法被引量:16
- 2009年
- 提出一种在概率数据流上进行聚类的有效方法P-Stream.P-Stream针对数据流上的概率元组提出强簇、过渡簇和弱簇的概念,设计一种有效的在线候选簇选择策略,为每个不断到达的数据元组合理地找到可能归属的簇,并在每个检查点存储微簇快照,以便离线进一步高层聚类和演化分析.最后设计一个"积极"的二层聚类模型来判断现有的第1层聚类模型是否还适应数据流中最近到达的概率元组.实验采用KDD-CUP’98和KDD-CUP’99真实数据集以及变换高斯分布的人工数据集构造概率数据流.实验结果表明,P-Stream具有良好的聚类质量、较快的处理速度,能够有效地适应数据演化情况.
- 戴东波赵杠孙圣力
- 关键词:概率数据流聚类