公共文化服务平台

共 3 条记录，以下是 1-3

全选清除导出

排序方式：

Data Dependence Graph Directed Scheduling for Clustered VLIW Architectures: 2010年; This paper presents an instruction scheduling and cluster assignment approach for clustered very long instruction words （VLIW） processors. The technique produces high performance code by simultaneously balancing instructions among clusters and minimizing the amount of inter-cluster data communications. The scheme is evaluated based on benchmarks extracted from UTDSP. Results show a significant speedup compared with previously used techniques with speed-ups of up to 44%, with average speed-ups ranging from 14% （2-cluster） to 18% （4-cluster）.; 杨旭何虎孙义和

利用后溯重调度过程优化簇间数据交互: 2009年; 在多簇处理器情况下,指令应用所带来的簇间数据交互问题已经成为制约处理器性能的关键问题。针对此问题提出了在一般的调度后进行一次后溯重调度优化过程,减少了簇间的数据交互量,提高了编译器关于处理器的利用率,同时减少了编译生成的指令序列运行时所消耗的功耗。实验结果表明,利用该方法进行调度,比列表调度算法簇间数据交互量减少平均44.36%,调度后的指令执行时间的平均减少量为24.93%,比UAS(unified assign and schedule)调度算法簇间数据交互量减少平均31.25%,调度后的指令执行时间的平均减少量为14.62%。; 杨旭何虎孙义和; 关键词：分簇

分簇VLIW结构下利用数据依赖图优化调度的研究被引量：1: 2011年; 应用的需求促使如今的处理器必须尽可能高地利用程序中所存在的指令级并行度,然而,高指令级并行的硬件和指令调度技术会给寄存器资源带来极大的压力.要在单一寄存器堆的情况下,既维持高的指令级并行度,又保持高的运行时钟频率是一件非常困难的事情,这是因为,当指令级并行度足够高时,在单一寄存器堆情况下,寄存器堆访问端口数目的限制会使得对寄存器堆的访问时间成为制约性能提高的关键因素.为了在利用高的指令级并行度的同时维持高的运行时钟频率,可以将寄存器堆和功能单元划分到不同的簇中.每一个簇中的功能单元可以直接访问簇内的寄存器堆,而簇间的数据交互则需要占用专用的资源来进行.因此,分簇结构下的编译器不仅要通过调度实现最大程序的指令级并行度,还应该对指令的分簇进行细致的安排以限制簇间的数据交互.该文致力于通过对数据依赖图(Data Dependence Graph)分析和划分,从而在最小化簇间的数据交互的同时,平衡各簇的利用情况,提高能够获得的指令级并行度,从而优化分簇式VLIW结构的调度性能.实验结果证明,该文所提出的方法可以极大地减少簇间的数据交互量,提高所能获得的指令级并行度,从而对调度结果的性能加以改善.; 杨旭何虎孙义和; 关键词：分簇 VLIW结构指令调度

全选清除导出

共1页<1>

国家自然科学基金(60236030)

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

国家自然科学基金(60236030)

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈