针对当前大规模高维数据集skyline计算效率较低的问题,提出了一种多核并行算法MPSSI(Multi-core Par-allel Skyline computation based on Sorting and Incomparability)。首先对数据集进行预排序处理,简化了后续计算过程;并通过精心选择枢轴点,将数据空间划分为若干区域,利用区域支配关系,减少了数据点之间的支配测试次数;同时在多核平台上对计算过程进行并行化处理,进一步提高了效率。MPSSI算法处理过程简洁、渐进性好、可扩展性强。实验结果表明,对大规模高维数据集,算法效率有大幅提升,相对加速比接近线性。
为提升大规模多维数据集的skyline计算效率,提出了一种多核并行算法MPSCS(multi-core parallelskyline computation based on sorting).首先按照任意一维对数据集进行预排序,然后划分为多个子集,使用skeleton并行程序设计模型进行并行化处理.与未采用预排序策略的多核并行算法相比,MPSCS算法处理过程简单,具有较好的渐进性、用户友好性和效率.实验结果表明,对规模较大、维数较高的数据集,效率可提高30%~40%,相对加速比可达线性.