唐亮
- 作品数:7 被引量:9H指数:2
- 供职机构:北京师范大学信息科学与技术学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于GPU的快速图像细化
- 图像细化是一种计算量较大的高度并行化算法,现有的CPU处理技术难以满足其对实时性的要求.在利用图形处理器GPU对数字图像处理进行加速的研究中,本文对传统的Rosenfeld图像细化算法进行了如下改进:首先对数据结构进行了...
- 朱佩佩赵国兴唐亮骆祖莹
- 关键词:图像细化图形处理器中央处理器
- 文献传递
- 考虑温度/功耗/热导之间相互作用的单循环迭代热分析算法被引量:1
- 2016年
- 随着纳米工艺的不断改进,温度对漏电流功耗和热导的影响日益显著.考虑温度/功耗/热导相互作用的3D芯片热分析需要采用迭代方法对温度进行精确求解,即先用功耗密度向量和热导矩阵来求解温度向量,再用求解出来的温度向量来刷新功耗密度向量和热导矩阵.为了提高3D芯片热分析的效率,本文以一个设定温度值下的均匀热导矩阵作为预条件,先提出了一种双循环、内循环低迭代次数的高效求解算法TPG-FTCG.鉴于TPG-FTCG具有超快的内循环收敛速度,本文省去了TPG-FTCG算法的内循环部分,提出了一种单循环、低迭代次数的TPG求解算法TPG-Sli.基于GPU(Graphics Processing Unit)并行加速技术,本文编写并改进了TPG-Sli的GPU加速算法.实验数据表明:与采用经典高效的ICCG算法进行3D芯片热分析的TPG-ICCG算法相比,在足够小的误差范围内,TPG-Sli的GPU加速算法可以获得120倍的速度提升.
- 潘月斗王嘉琪唐亮骆祖莹
- 关键词:热分析快速傅里叶变换GPU并行
- 利于GPU计算具有线性并行度的P/G网SOR求解算法被引量:3
- 2013年
- 近年来电子设计自动化(EDA)研究人员尝试利用图形处理器(graphic processing unit,GPU)提供的高性能计算能力对IC参数分析进行加速研究.为了利用GPU进行电源线/地线网络(power/ground network,P/G网)快速分析,设计了一种基于经典的连续过松弛(successive over-relaxation,SOR)算法的高效P/G网分析并行算法.基于GPU并行计算加速原理,此算法进行了如下改进:1)采用红-黑次序的松弛策略.将所有的节点分为红黑两类,红色节点的所有邻点只有黑色节点、黑色节点的所有邻点只有红色节点,红色节点与黑色节点交替松弛,保证了GPU并行计算中的数据一致性.对于具有N个节点的P/G网而言,一次红色节点或黑色节点松弛可以同时对N/2个节点进行松弛操作,即理论上可以同时启动N?2个并行线程.2)优化数据结构.实现了对数据空间的合并访问,以保证对GPU全局存储空间的最优访问.3)在共享存储器内通过并行归约对松弛标记进行快速统计,同时利用zero-copy技术进行松弛标记的快速拷贝,以快速决定是否继续松弛.大量的实验结果表明:与单线程的CPU程序相比,此算法的加速倍数随GPU所提供物理线程的数目增加而线性增加,可以获得最大242倍的加速效果,是目前EDA研究领域中加速效果最好的GPU算法.
- 唐亮骆祖莹赵国兴杨旭
- 关键词:统一计算设备架构
- 基于GPU的超大规模集成电路电热综合分析
- 供电电压与工作温度直接影响集成电路(IC)的性能,因此,在IC设计中必须进行电热分析.P/G分析和3D热分析是电热分析的两个主要方面,分别用来对芯片的供电电压和工作温度进行求解.与现有的电热分析相比,本文综合考虑了温度(...
- 唐亮李晓怡骆祖莹
- 关键词:超大规模集成电路图形处理器并行计算
- 文献传递
- 考虑电压/温度变化的电热综合分析及其并行加速技术被引量:1
- 2013年
- 受限于计算能力,在现有的电热分析研究中,无法考虑电压变化对电热分析的影响,从而降低了分析的精度.基于已有的研究成果,文中分析了芯片的功耗/电压/温度分布向量之间的相互关系,指出了在电热综合分析中考虑电压/温度变化的必要性,进而提出了一种迭代式的并行电热综合分析方法ETA_VT,该方法基于功耗与电压/温度之间的递归关系,进行迭代计算,最后将收敛后的功耗/电压/温度分布向量作为求解结果同时输出.基于多核CPU+众核GPU异构计算机系统所提供的并行计算资源,为了提高电热综合分析的运行效率,文中不仅设计了一个具有主辅双进程的ETA_VT算法流程,而且还分别采用CPU多线程并行计算、GPU并行计算、CPU+GPU协同并行计算技术对ETA_VT算法进行加速研究.实验数据表明:(1)考虑电压/温度变化的电热综合分析不仅可以获得较为精确的分析结果,而且可以同时计算出芯片的功耗/电压/温度分布;(2)采用并行计算技术、并合理分配计算资源,不仅可以解决电热综合分析中存在的功耗/电压/温度多参量相互影响的问题,而且还可以有效地提高电热综合分析的速度,获得多达44倍的加速效果.文中工作是将高性能计算引入电子设计自动化(EDA)算法研究的一次有益尝试,表明高性能计算技术不仅可以提高EDA算法的执行效率,而且可以促进芯片设计中存在的多参量相互影响综合分析问题的研究和解决.
- 赵国兴骆祖莹黄琨唐亮
- 关键词:PGPU计算
- 考虑温度对漏电流功耗影响的MPSoC结构级热分析方法被引量:5
- 2013年
- 为了更高效地实现多核片上系统(MPSoC)温敏布图设计和实时功耗温度管理,采用自下而上的建模方法,提出MPSoC结构级热分析方法.首先采用HotSpot热分析软件提取功能模块之间的相关热阻参数;然后基于这些参数,提出模块级方法BloTAM、核级方法CorTAM和考虑本核内模块相互影响的改良核级方法BiCorTAM 3种具有不同复杂度与精度的热分析方法,它们均具有简单、高效、与现有简化模型兼容、易于扩展、能够解决考虑温度对漏电流的影响等优点.实验结果表明,对MPSoC进行热分析时,相对于HotSpot热分析软件,BloTAM和BiCorTAM方法都可以在保证精度的前提下大幅度提高热分析的速度,其中局部热点的温度增量平均误差可以控制在3%以下,热分析的速度实现了50倍以上的分析加速;两者均可作为理想的结构级热分析方法.
- 闫佳琪骆祖莹唐亮赵国兴
- 片上P/G网求解算法及其GPU上的并行化
- 2014年
- 为了得到片上电源线/地线网络(P/G网)快速而准确的求解算法,根据结构化供电网的局部性效应,重新分析了连续过松弛迭代法(SOR)和变向隐含迭代法(ADI)在P/G网中的求解效率及并行性,提出了利于GPU加速的并行算法:G_RBSOR和G_ADI.它们均采用规则的数据结构,以利于GPU并行读写数据,并采用合并归约来并行计算迭代结束标志位.为了避免GPU计算的数据冲突,G_RBSOR算法采用棋盘格方式对电路节点进行红黑分类,并对红黑节点进行交错松弛.实验结果表明,在不损失精度的前提下,与各自对应的CPU串行算法相比,G_RBSOR和G_ADI算法均取得了超过50倍的加速效果;与高效的P/G分析串行求解算法ICCG相比,也取得了超过5倍的加速效果.
- 唐亮潘月斗王嘉琪骆祖莹
- 关键词:图形处理器并行计算