国家教育部博士点基金(20050246020)
- 作品数:6 被引量:14H指数:3
- 相关作者:臧斌宇朱传琪朱嘉华张宏江徐超豪更多>>
- 相关机构:复旦大学江南计算技术研究所更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于共享向量的二维SIMD调度算法被引量:3
- 2006年
- 针对目前二维SIMD结构编译技术研究的不足,结合二维SIMD结构中普遍采用的复用数据通路和寄存器少的限制和应用程序的特点,提出了一种解决数据向量复用的算法.该算法先使用数据向量的代表元计算各SIMD指令间数据向量的重用信息,再根据这些信息对SIMD指令进行调度.该算法可以有效缓解应用程序在二维SIMD结构执行时加载数据的压力,有效提高结构受限二维SIMD结构的并行性.实验数据显示,该算法对各种应用程序可获得平均2.97的加速比和平均3.86的SIMD指令级并行度.
- 张为华臧斌宇王晔钱兴隆朱传琪
- 关键词:代表元调度
- 元数据展开的动态二进制翻译寄存器化优化被引量:1
- 2008年
- 动态二进制翻译技术可以使编译好的二进制代码无缝运行于其他架构下,目前得到越来越广泛的应用.由于在动态翻译执行的过程中缺少程序的原始语义信息而只能采用保守的策略来保证程序的正确性,从而制约到动态二进制翻译的性能.为了解决这种不足,本文提出一种基于静态编译阶段产生的对性能有影响的元数据进行动态翻译中的寄存器化优化算法,进而来提高动态翻译器的整体性能.实验数据表明优化方法对于SPECfp2000和SPECint2000测试集分别获得了15.03%和1.21%的性能提升,其中的一些测试包的加速比甚至达到了37.09%.
- 鲍弢鲁云萍徐超豪臧斌宇
- 关键词:元信息
- 周期常量的检测与传播
- 2006年
- 周期常量是指循环中值呈周期性出现的递归标量.它的存在不仅带来循环内与跨循环数据相关,更导致一些不必要的控制相关.该文介绍了周期常量的概念及递归标量转化为差分方程的过程,并应用代数的相关知识提出并证明了周期常量存在的一个充分必要条件,由此给出了检测与传播周期常量的一个有效算法.该算法应用于ADPCM编/解码器,得到了平均超过10%的加速比.
- 陈海波朱嘉华张宏江臧斌宇
- 关键词:差分方程周期解
- 一种基于代表元的划分算法被引量:5
- 2008年
- 划分是把程序中不同的计算和数据分配到并行处理系统的不同处理机来充分利用并行系统的计算资源、提高程序处理速度的一种优化技术.划分的效果对程序在并行系统上的执行效率将产生至关重要的影响,因此划分问题一直是并行领域研究的一个热点.但是应用程序的一些特性,如非紧密嵌套循环、一条语句对非只读数组的多次引用间存在重叠、不同语句对同一数组不同步长的引用,给有效解决划分问题设置了极大的障碍.已有的划分算法无法对具有这些特征的程序进行自动划分.虽然在对具有这些特征的程序进行手工优化过程中,存在一些直观上的划分策略,但这些策略无法应用到编译器中来指导编译器完成对程序的自动划分.文中根据这类程序的特点,提出了一种基于代表元的划分算法.该算法通过使用程序中对划分计算产生实际影响的数组引用作为代表元素构造各种划分的限制条件,完成程序的划分.同时通过寻找最大一致性数据划分方向有效减少了程序划分过程中的数据重组织通信.该算法已经在AFT2004中实现,并对应用程序获得了很好的效果.
- 张为华王鹏臧斌宇朱传琪
- 关键词:数据划分代表元
- 间接转移指令在动态二进制翻译器中的预测方法被引量:1
- 2007年
- 动态二进制翻译器中间接转移指令的预测优化对其性能至关重要.在研究了动态二进制翻译器的取值信息收集框架后,给出如何在程序运行起始阶段对间接转移指令的目标地址进行取值信息收集的方法,并结合统计原理,提出对目标地址的预测应该结合取值信息进行区间估计.最后,提出了一个基于取值信息收集分析结果进行目标地址预测的优化决策函数并且通过在动态二进制翻译器"IA-32 Execution Layer"上进行实验验证了该决策函数对于间接转移指令预测的效果,并讨论了其准确性和精确度.
- 徐超豪臧斌宇
- 关键词:动态二进制翻译
- 基于位宽控制提高SIMD架构并行度的优化算法被引量:5
- 2009年
- 随着SIMD功能单元作为多媒体加速部件的广泛应用,如何有效利用这一构架优化应用程序成为编译优化研究的热点.目前典型的SIMD结构为同一操作对不同的数据位宽提供了不同的指令版本,随着操作数位宽的增加,对应的SIMD指令可同时完成的操作个数也随之降低.因此,如何有效识别操作数的有效位宽,对提高优化过程中SIMD指令内操作的并行度将产生至关重要的影响.文中针对SIMD优化面临的并行度问题,提出了一种优化算法,该算法在对操作数的有效位进行分析的基础上,进行溢出控制,从而减少操作数对宽位宽数据类型的依赖.实验数据表明,该算法可以有效提高多媒体程序优化的并行度,对多媒体程序获得较好的加速效果.
- 张为华朱嘉华张宏江臧斌宇
- 关键词:并行度