陈彧
- 作品数:9 被引量:14H指数:2
- 供职机构:清华大学信息科学技术学院计算机科学与技术系更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- IA-64体系结构中软件流水技术的研究
- 对IA-64体系结构中软件流水技术进行了研究。文章阐述了软件流水技术的特点;分析了软件流水的寄存器需求;提出了寄存器不足的解决方法,并介绍了实验结果。
- 陈彧李文龙李胜梅刘利汤志忠
- 关键词:软件开发调度算法
- 一种在软件流水中开发存储系统优化潜力的方法
- 本文分析存储系统延迟的主要原因,提出退化链数据猜测方法,该方法利用数据猜测打破循环的有环相关图中某些限制,拓宽内存访问操作的指令调度空间。实验证明,该方法可以开发软件流水对存储系统的优化潜力。
- 陈彧李文龙汤志忠
- 文献传递
- 软件流水调度技术的研究
- 流水是开发循环程序指令级并行性的重要调度技术,其有效性受到2方面的限制:一方面软件流水的开销抵消了它的性能;另一方面,过高的寄存器压力限制了它的应用.本文分析了软件流水的开销,提出了决策启发式,为其应用提供了引导,避免软...
- 李文龙林海波陈彧汤志忠
- 关键词:寄存器调度技术
- 新兴多核工作负载访存行为的定量分析
- 2011年
- 工作负载分析是片上多处理器末级缓存设计的关键先导工作。分析了一组访存密集型多线程RMS(recognition-mining-synthesis)工作负载工作集大小、数据共享行为和空间局部性等访存行为,研究了末级缓存的设计空间,探讨了未来片上多处理器的缓存体系结构设计。实验结果表明:大容量DRAM缓存有助于满足这组负载的大工作集对缓存容量的需求,使用128MB DRAM缓存比不使用时平均可以减少18%的L1缓存缺失延迟;共享缓存设计比私有设计性能更好,8MB的共享缓存可以比相同总容量的私有缓存提高25%的缓存性能;基于步长的硬件数据预取机制可以提高25%的性能。因此,对于访存密集型RMS负载,宜采用一个128MB的DRAM缓存、一个8MB片上SRAM缓存,结合一个8表项的流式预取器,构成缓存子系统。
- 林隽民陈彧李文龙乔林汤志忠
- 关键词:片上多处理器
- 利用循环分割和循环展开避免Cache代价被引量:2
- 2008年
- 存储系统与处理器之间的速度差距逐渐变大,为此,cache使用了分级机制,但这也带来了额外的存储延迟(cache代价).提出一种利用循环分割和循环展开相结合避免cache代价的PCPLPU(prevent cache penalty by loop partition-unrolling)算法.实验结果表明,PCPLPU算法能够有效避免循环代价,提高程序性能.
- 刘利陈彧乔林汤志忠
- SAGA:一种由流特性制导的微处理器高速缓存分配策略被引量:1
- 2008年
- 传统的缓存替换策略,如广泛使用的LRU算法,在程序工作集大于缓存容量的情况下,不能有效开发流式数据的重用性,导致缓存性能很差.文中提出一种流特性制导的缓存分配策略(SAGA).该策略利用流检测引擎来发掘程序中的流特性信息,进而动态地在发生缓存缺失时指导是否为缺失数据分配缓存块,最终提高数据缓存的性能.实验表明,对于SPEC2000FP程序集,在1MB缓存上,比较于LRU策略,使用SAGA策略时缓存的缺失平均减少了31%,程序平均CPI降低4%.
- 陈彧林隽民乔林汤志忠
- 关键词:高速缓存
- 减小运行时优化开销的方法被引量:1
- 2006年
- 运行时优化在程序运行期间,根据采集到的相关信息,确定程序的热点并进行优化,从而加速程序的执行。然而,运行时优化本身有一定的开销,有时候会抵消甚至超出优化得到的效果。该文设计和实现了一个基于SMP/IPF(英特尔安腾系列)/Linux架构的自适应二进制代码优化/编译框架,其中包含了运行时优化。分析了运行时优化的阶段和开销,并介绍了在设计和实现该框架的过程中,为减小这种开销所提出的思路和采用的方法。
- 郭振宇刘利陈彧汤志忠
- 关键词:运行时优化
- 3种提高软件流水有效性的算法:比较和结合被引量:2
- 2005年
- 软件流水是开发循环程序指令级并行性的技术,它通过并行执行连续的多个循环体来加快循环的执行速度.在软件流水中,循环体的重叠增加了寄存器需求,导致寄存器压力增大,当目标处理机所提供的寄存器不足时,软件流水可能失败.在Itanium处理机上评估了NAS和SPEC2000基准程序中的软件流水循环的寄存器需求,发现静态寄存器不足是造成软件流水失败的主要原因,提出了3种增加软件流水个数、提高软件流水有效性的算法:限制循环展开因子的算法(registersensitiveunrolling,简称RSU)、堆栈寄存器分配算法(stackedregisterallocation,简称SRA)以及变量类型转换的算法(variabletypeconversion,简称VTC).RSU根据静态寄存器需求确定一个合理的展开因子,增加了软件流水的成功率;SRA和VTC分别使用空闲的堆栈寄存器和旋转寄存器来充当静态寄存器,提高了寄存器的利用率.在面向Itanium处理器的开放源码编译器ORC(openresearchcompiler)上实现了这3种算法,通过NAS程序的测试比较了这3种算法的有效性,同时对它们的结合应用进行了研究和实验.
- 李文龙陈彧林海波汤志忠
- 关键词:ITANIUM寄存器分配
- 软件流水中隐藏存储延迟的方法被引量:8
- 2005年
- 软件流水是一种重要的指令调度技术,它通过同时执行来自不同循环体的指令来加快循环的执行速度.随着处理机运行速度的逐渐提高,存储访问延迟成为性能提高的瓶颈.为了减轻存储系统影响,软件流水结合了一些存储优化技术,通过隐藏存储延迟来提高性能.提出了一种延迟可预测的模调度算法(foresightedlatencymoduloscheduling,简称FLMS),它根据循环的特点来确定load指令延迟.实验结果表明,FLMS算法减少了阻塞时间,提高了程序性能.
- 刘利李文龙陈彧李胜梅汤志忠
- 关键词:LATENCY