国家自然科学基金(60273046) 作品数:8 被引量:27 H指数:4 相关作者: 臧斌宇 朱传琪 朱嘉华 张宏江 王晔 更多>> 相关机构: 复旦大学 江南计算技术研究所 更多>> 发文基金: 国家自然科学基金 国家教育部博士点基金 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
周期常量的检测与传播 2006年 周期常量是指循环中值呈周期性出现的递归标量.它的存在不仅带来循环内与跨循环数据相关,更导致一些不必要的控制相关.该文介绍了周期常量的概念及递归标量转化为差分方程的过程,并应用代数的相关知识提出并证明了周期常量存在的一个充分必要条件,由此给出了检测与传播周期常量的一个有效算法.该算法应用于ADPCM编/解码器,得到了平均超过10%的加速比. 陈海波 朱嘉华 张宏江 臧斌宇关键词:差分方程 周期解 一种针对多媒体扩展指令集和实际多媒体程序的自动向量化方法 被引量:4 2005年 自动向量化编译是利用处理器的多媒体扩展指令集提升多媒体程序性能的理想工具.但目前的研究不能有效加速实际程序.其主要原因是:普通算术操作的向量化不一定有性能提升;而多媒体典型操作因为其在源代码中表现形式多样而不能充分向量化.为了解决这一问题,文章对经典向量化算法[1]进行改进以灵活统一地向量化这两类操作.主要的改进是增加了两个步骤:统一操作的不同表现形式和识别有价值的向量化操作.改进后的算法可以充分利用指令集生成高效代码,从而对实际多媒体程序拥有良好效果.此外,该算法可扩展性也很强. 姜伟华 梅超 郭一 朱嘉华 臧斌宇 朱传琪多媒体程序中消除控制相关的技术研究 被引量:1 2006年 随着多媒体应用的快速发展,最大程度地提升多媒体程序的性能逐渐变为计算机领域研究的热点。硬件平台和多媒体程序的特点是该领域研究需要关注的两个主要方面,当前的主流桌面处理器在提升主频的同时也增大了分支预测失误的开销,而多媒体应用程序中分支语句的大量使用进一步增大了分支预测失误的概率。我们在优化多媒体程序测试包BMW(BerkeleyMultimediaWorkload)过程中发现,通过消除程序中的控制相关,尽量减少程序中的分支指令可以显著地提升程序的性能。本文首先讨论了多媒体程序中消除控制相关的一些基本优化方法。针对当前主流处理器引入多媒体扩展指令集来优化程序的趋势,本文进一步总结了在SIMD架构下使用多媒体扩展指令集消除控制相关的方法。这两方面的优化方法应用到实际程序中,得到的平均性能提升分别为7%和26%。 张宏江 臧斌宇 朱传琪保证Java精确异常的软件流水线技术 被引量:2 2008年 Java对精确异常的支持严重限制了JIT编译器的动态优化的能力。目前已经有不少在精确异常存在下的优化技术,但它们都是针对代码块内部顺序指令的调度算法,依然没有在软件流水线这样循环级别做带精确异常的优化的算法。针对存在精确异常要求的Java程序,提出了一种软件流水线的算法,并以安腾作为底层平台对该算法进行了测试,实验结果显示该算法在保证Ja-va精确异常要求的情况下能够大幅度提高Java程序的性能。 倪奇智 张为华 臧斌宇 朱传琪关键词:JAVA 基于共享向量的二维SIMD调度算法 被引量:3 2006年 针对目前二维SIMD结构编译技术研究的不足,结合二维SIMD结构中普遍采用的复用数据通路和寄存器少的限制和应用程序的特点,提出了一种解决数据向量复用的算法.该算法先使用数据向量的代表元计算各SIMD指令间数据向量的重用信息,再根据这些信息对SIMD指令进行调度.该算法可以有效缓解应用程序在二维SIMD结构执行时加载数据的压力,有效提高结构受限二维SIMD结构的并行性.实验数据显示,该算法对各种应用程序可获得平均2.97的加速比和平均3.86的SIMD指令级并行度. 张为华 臧斌宇 王晔 钱兴隆 朱传琪关键词:代表元 调度 利用U模变换增加并行粒度与改善数据访问局部性的方法 被引量:4 2004年 提出了一种利用循环变换增加循环并行粒度 ,改善循环数据访问局部性的方法 .该方法利用了给定二重循环的相关向量集的某些性质 ,将外层循环变量不同而内层循环变量相等的若干次迭代合并 ,成为折叠后迭代空间的一个结点 ,并且保持内层循环的并行性不变 ,从而达到增加循环并行粒度的目的 .对于更普遍的情况 ,该文讨论了如何根据给定循环的循环向量集 ,确定一个U模变换对迭代空间进行变换 ,达到内层循环可并行和扩大循环粒度两个目的 .针对循环变换中数据访问局部性可能变差的问题 ,该文提出了对内层循环先合并 ,根据合并后的相关向量集变换迭代空间 ,以及折叠迭代空间的方法 .该文的方法是wavefront循环并行化方法的一种扩展 . 马国凯 王欣孃 王鹏 臧斌宇 朱传琪关键词:并行化编译 基于位宽控制提高SIMD架构并行度的优化算法 被引量:5 2009年 随着SIMD功能单元作为多媒体加速部件的广泛应用,如何有效利用这一构架优化应用程序成为编译优化研究的热点.目前典型的SIMD结构为同一操作对不同的数据位宽提供了不同的指令版本,随着操作数位宽的增加,对应的SIMD指令可同时完成的操作个数也随之降低.因此,如何有效识别操作数的有效位宽,对提高优化过程中SIMD指令内操作的并行度将产生至关重要的影响.文中针对SIMD优化面临的并行度问题,提出了一种优化算法,该算法在对操作数的有效位进行分析的基础上,进行溢出控制,从而减少操作数对宽位宽数据类型的依赖.实验数据表明,该算法可以有效提高多媒体程序优化的并行度,对多媒体程序获得较好的加速效果. 张为华 朱嘉华 张宏江 臧斌宇关键词:并行度 一种可重配置系统的模型 被引量:10 2006年 U n ivers ity of C a liforn ia,Irv ine设计的M orphoSys M 1作为粗粒度可重配置系统中一个比较有代表性的系统,对于很多多媒体应用都获得了很好的加速比,但是它在设计上的一些不足造成运算功能单元没有被充分利用,从而对其整体性能的进一步提升有较大影响.针对M orphoSys M 1的不足,结合可重配置系统的研究现状和一些多媒体应用的特点,提出了一种新的可重配置系统的模型.实验数据显示,对于许多多媒体应用和加解密算法,改进后的模型相对于M orphoSys M 1至少可以获得16%的加速比. 张为华 王晔 鲁云萍 臧斌宇 朱传琪关键词:M1 多媒体 超长指令字