狄鹏
- 作品数:4 被引量:6H指数:2
- 供职机构:北京科技大学计算机与通信工程学院更多>>
- 发文基金:国家高技术研究发展计划教育部科学技术研究重点项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 网格环境下基于XML的文件数据仓库的传输策略被引量:1
- 2007年
- 针对具有服务质量(QoS)的XML文件数据仓库传输策略进行分析.通过引入并行传输机制,对网格环境下的数据仓库并行传输的体系结构进行了研究,提出一种新的XML文件传输策略,利用解析减小数据传输量,提高传输效率.最后通过模拟测试对数据传输质量控制进行性能测评,证明新策略在大多数情况下可以有效、正确地提高文件传输效率,同时分析了这种传输策略不能提高效率的情况.测试结果证明通过这种策略可以明显改善在网格环境下的数据仓库模型.
- 狄鹏胡长军王鑫李建江
- 关键词:网格数据仓库可扩展标识语言服务质量
- 一类基于迭代空间条块的并行有限差分Stencil算法
- 高效的并行有限差分Stencil 算法对于求解大型线性方程组是十分重要的。针对并行有限差分Stencil 算法中数据局部性差、同步和通信开销大的问题。首先改进传统有限差分Stencil 算法,提出了多层对称遍历有限差分 ...
- 张纪林狄鹏徐向华万健
- 关键词:迭代算法数据局部性通信优化
- 一种高效直方图生成算法在GPU上的实现被引量:2
- 2012年
- 直方图生成算法(Histogram Generation)是一种顺序的非规则数据依赖的循环运算,已在许多领域被广泛应用。但是,由于非规则的内存访问,使得多线程对共享内存访问会产生很多存储体冲突(Bank Conflict),从而阻碍并行效率。如何在并行处理器平台,特别是当前最先进的图像处理单元(Graphic Processing Unit,GPU)实现高效的直方图生成算法是很有研究价值的。为了减少直方图生成过程中的存储体冲突,通过内存填充技术,将多线程的共享内存访问均匀地分散到各个存储体,可以大幅减少直方图生成算法在GPU上的内存访问延时。同时,通过提出有效可靠的近似最优配置搜索模型,可以指导用户配置GPU执行参数,以获得更高的性能。经实验验证,在实际应用中,改良后的算法比原有算法性能提高了42%~88%。
- 狄鹏胡长军李建江
- 关键词:图像处理单元
- GPU上高效Jacobi迭代算法的研究与实现被引量:3
- 2012年
- Jacobi迭代算法是一种求解偏微分方程组的常用循环运算.由于该算法存在语句间的数据相关,阻碍了其在图像处理单元(Graphic Processing Unit,GPU)等并行计算平台的高效实现.通过数学证明与实验验证,比较不同的循环优化策略,消除语句间数据相关,增强数据局部性,从而获得更高的执行性能.此外,利用块(Tile)大小选取模型,合理的划分计算数据,充分利用GPU的运算资源,进一步提高性能.实验结果表明,Jacobi奇偶复制算法比传统Jacobi并行算法在GPU上的性能提高4倍以上.
- 狄鹏胡长军李建江
- 关键词:图像处理单元