林隽民
- 作品数:9 被引量:3H指数:1
- 供职机构:清华大学信息科学技术学院计算机科学与技术系更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 新兴多核工作负载访存行为的定量分析
- 2011年
- 工作负载分析是片上多处理器末级缓存设计的关键先导工作。分析了一组访存密集型多线程RMS(recognition-mining-synthesis)工作负载工作集大小、数据共享行为和空间局部性等访存行为,研究了末级缓存的设计空间,探讨了未来片上多处理器的缓存体系结构设计。实验结果表明:大容量DRAM缓存有助于满足这组负载的大工作集对缓存容量的需求,使用128MB DRAM缓存比不使用时平均可以减少18%的L1缓存缺失延迟;共享缓存设计比私有设计性能更好,8MB的共享缓存可以比相同总容量的私有缓存提高25%的缓存性能;基于步长的硬件数据预取机制可以提高25%的性能。因此,对于访存密集型RMS负载,宜采用一个128MB的DRAM缓存、一个8MB片上SRAM缓存,结合一个8表项的流式预取器,构成缓存子系统。
- 林隽民陈彧李文龙乔林汤志忠
- 关键词:片上多处理器
- 带分支循环的软件流水算法
- 本文提出了一种新的软件流水算法--可变启动间距的软件流水算法,利用IA-64中的硬件支持优化中间转移代码.不仅提高了转移代码的效率,同时各路径实现了最优或者近似最优的调度.
- 李文龙林隽民汤志忠
- 关键词:微处理器模调度
- 文献传递
- 一种基于重用距离预测与流检测的高速缓存替换算法被引量:1
- 2012年
- 传统的缓存替换算法由于不能适应应用程序的流式访问行为而导致缓存性能不佳.设计基于周期检测的预测方法,分析程序访存重用距离的规律性和流式访问的复杂性,提出用重用距离预测能同时适应简单流和复杂流访问模式的RDP算法.RDP的基本思想是预测重用距离并动态维护重用距离计数,动态调整缓存数据的替换顺序,通过流采样缩减存储开销.实验结果表明,RDP算法能够很好地适应程序中多样化的流访问模式,其总体性能优于LRU算法和DIP算法,在32MB缓存上比传统LRU算法平均减少了27.5%的缓存缺失.
- 林隽民王炜乔林汤志忠
- 关键词:高速缓存
- 基于IA-64体系结构的软件流水优化的研究
- 软件流水是开发循环指令级并行的重要编译技术。IA-64是一种显式并行指令计算体系结构,它利用编译程序和处理器的协同能力来提高指令并行度。IA-64提供了许多新特性,支持包括软件流水在内的编译优化技术的应用。在IA-64体...
- 林隽民
- 文献传递
- 一种计算循环展开因子的算法
- 软件流水一种有效的用于开发循环体间指令级并行性的优化技术,循环展开是另一种用于开发循环指令级并行性的技术.研究表明,在软件流水前应用循环展开可以进一步提高编译器的性能.如何确定一个合理的展开因子,充分发挥循环展开和软件流...
- 李文龙林隽民汤志忠
- 关键词:指令级并行性
- 文献传递
- 模调度分支指令的缓存
- 本文首先讲述了模调度缓存的机制,讨论循环中分支的转化,然后提出了两种分子缓存的硬件实现机制,并对两种机制进行了比较,最后总结全文作进一步研究.
- 李文龙林隽民汤志忠
- 文献传递
- SAGA:一种由流特性制导的微处理器高速缓存分配策略被引量:1
- 2008年
- 传统的缓存替换策略,如广泛使用的LRU算法,在程序工作集大于缓存容量的情况下,不能有效开发流式数据的重用性,导致缓存性能很差.文中提出一种流特性制导的缓存分配策略(SAGA).该策略利用流检测引擎来发掘程序中的流特性信息,进而动态地在发生缓存缺失时指导是否为缺失数据分配缓存块,最终提高数据缓存的性能.实验表明,对于SPEC2000FP程序集,在1MB缓存上,比较于LRU策略,使用SAGA策略时缓存的缺失平均减少了31%,程序平均CPI降低4%.
- 陈彧林隽民乔林汤志忠
- 关键词:高速缓存
- IA-64中软件数据预取的优化被引量:1
- 2004年
- 软件数据预取是一种有效的隐藏存储延迟的技术。IA- 6 4是支持软件数据预取和软件流水的 EPIC(显式并行指令计算 )体系结构。软件数据预取不是一种无损的技术 ,其引入的开销有时会降低程序的性能。提出了降低软件流水中数据预取开销的算法 ,利用旋转寄存器的特性合并具有相同类型的预取操作。在 ORC(open research compiler)中实现了此算法 ,并对 SPEC CFP2 0 0 0基准程序进行了测试。实验结果表明此算法有效减少了冗余数据操作的个数 。
- 李文龙林隽民汤志忠
- 带分支循环软件流水的一种寄存器访问机制
- 对于有分支循环的软件流水,用带硬件支持的数据相关松弛方法可以在控制代码膨胀的同时,得到自适应的启动间距.数据相关松弛法生成模调度形式的静态调度结果,而执行时由硬件动态地改变启动间距.执行与调度的不一致会产生寄存器的引用问...
- 林隽民李文龙汤志忠
- 关键词:指令级并行模调度
- 文献传递