赵丽丽
- 作品数:2 被引量:27H指数:2
- 供职机构:西北工业大学计算机学院更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于CUDA的稀疏矩阵与矢量乘法的优化被引量:6
- 2010年
- 随着VLSI技术的发展,在单芯片上集成若干个处理器核的思想成为现实,现代GPU就是一个典型的多核处理器设备;由于面向计算密集型的应用发展非常迅速,当前的GPU又具有了较强的通用计算能力;全文首先介绍了CUDA和稀疏矩阵的相关知识;基于矩阵的CSR表示格式,文章提出了三种CUDA模型下的程序优化方法;论文分析并实现了这三种程序优化方法,在Geforce 9600GT上的实验结果表明,最大可以实现4倍左右的加速比。
- 周洪樊晓桠赵丽丽
- 关键词:CUDAGPGPUCSR并行计算
- 基于CUDA的高速FFT计算被引量:22
- 2011年
- 针对快速傅里叶算法FFT在图形图像处理和科学计算领域的重要作用,提出了一种基于CUDA的高速FFT计算方法,在分析GPU硬件平台执行模式及FFT算法并行性特征的基础上,采用多线程并行的映射方法实现算法,并从存储层次优化算法。实验结果表明了该算法的高效性,且优化后的FFT加速比能达到CUFFT库加速比的2~6倍。
- 赵丽丽张盛兵张萌姚涛
- 关键词:图形处理器统一计算架构映射策略