国家自然科学基金(60473079)
- 作品数:29 被引量:113H指数:5
- 相关作者:陈书明胡定磊扈啸万江华汪东更多>>
- 相关机构:国防科学技术大学并行与分布处理国防科技重点实验室廊坊广播电视大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 支持细粒度并行性开发的多核DSP快速核间通信机制被引量:2
- 2009年
- 一些数字信号处理程序存在强数据相关性,在将这些数字信号处理程序划分到多核DSP上时,需要开发细粒度并行性,而细粒度并行性的开发需要快速的核间通信机制支持。本文提出了一种新的面向多核DSP的快速核间通信机制:标记式共享寄存器文件TSRF,TSRF由所有的DSP核共享,寄存器文件中的每个寄存器同一个有效标记位关联,该标记位提供了核间通信同步支持。本文构建了集成TSRF机制的多核DSP原型的周期精确模拟器,该多核DSP原型包含的处理器核数目为4个。通过详细模拟,我们使用数据相关性较强的数字信号处理算法:IIR滤波和ADPCM编解码,对TSRF机制的性能进行了测试,与单核DSP相比,TSDB机制性能提升分别为1.8、1.2和1.9左右。
- 方兴陈书明
- 关键词:多核DSP细粒度并行
- 基于超块的统一分簇与模调度被引量:1
- 2007年
- 超长指令字处理器为了提高指令集并行(ILP)往往采用多个功能单元,从而需要多端口的寄存器文件提供支持.但是寄存器文件会随着端口的增多变得更复杂,频率难以提升,成为系统的瓶颈.分簇是解决这一问题的有效手段.分簇在不影响处理器ILP的前提下减少了每簇寄存器文件的端口数目,但对编译器提出了挑战,编译器必须将指令和操作数在簇间进行合理分配才能得到较好的指令级并行.针对分簇超长指令字结构提出了一种基于超块的统一分簇与模调度编译方法.使用超块技术可以增大调度范围以获得更好的ILP,并且可以处理含有控制流的循环体,增加了模调度的适用范围.超块中指令的分簇与模调度则是统一进行的,这将比分阶段进行有更好的优化效果,因为统一进行是从全局的角度寻求优化而非寻求各个阶段局部优化.在YHFT-DSP/700编译器中的实验结果表明,与ITSS算法相比,该算法可以达到较好的优化效果.
- 胡定磊陈书明刘春林
- 关键词:超长指令字编译器分簇模调度指令级并行
- DSCF:一种面向共享存储多核DSP的数据流分簇前向技术被引量:2
- 2008年
- 多核数字信号处理器(DSP)的性能常常受限于共享存储的长延迟Cache一致性访问.数据前向(forwarding)技术是隐藏长延迟访问的一种有效手段.根据多核DSP应用的两类重要特征,提出了一种面向共享存储多核DSP结构的数据流分簇前向技术DSCF(data stream clustered forwarding).DSCF方法的主要特点是:兼容基本的共享存储Cache一致性协议;不污染目标Cache;数据的传输速度能够与消费速度相匹配;系统结构的可扩展性好.典型测试程序的模拟评测表明,采用DSCF方法能够将Cache一致性失效率平均降低44%,将系统总体性能提升30%~70%.
- 汪东陈书明
- 关键词:多核DSPCACHE一致性数据流
- 高性能VLSI设计中时钟分布网络的问题与解决方法被引量:2
- 2007年
- 本文介绍了深亚微米工艺下高性能VLSI芯片中时钟分布网络设计所面临的问题,总结了时钟分布网络设计的一般方法,最后指出了时钟分布网络设计研究的发展方向。
- 刘祥远陈书明
- 关键词:抖动功耗时钟树
- 降低指令存储器功耗的一种有效方法:循环缓冲被引量:2
- 2007年
- 在超长指令字结构的数字信号处理器中,其指令存储器的功耗所占比重较大。但是,根据数字信号应用的特点,可以采用循环缓冲来减小指令存储器的功耗。本文提出了一种编译器控制的循环缓冲技术,由编译器选择合适的循环代码将其放入循环缓冲,从而减小了取指过程中指令存储器的功耗;给出了循环缓冲的体系结构设计、功耗分析以及有效利用循环缓冲的编译方法;最后用功能级功耗模型验证了该方法的有效性。
- 胡定磊陈书明
- 关键词:编译器低功耗
- 一种提高同时多线程VLIW处理器中取指单元吞吐率的方法被引量:2
- 2007年
- 在同时多线程处理器中,提高取指单元的吞吐率意味着各线程之间的Cache竞争更加激烈,而这种竞争又制约着取指单元吞吐率的提高。本文针对当前超长指令字体系结构的新特点,提出了一种同时提高取指单元和处理器吞吐率的方法。该方法通过尽可能早地作废取指流水线中的无效地址,减少了由无效取指导致的程序Cache冲突,也提高了整个处理器的性能。实验结果表明,该方法使处理器和取指单元的吞吐率均相对提高了12%~23%,而一级程序Cache的失效率则略微增加甚至降低。另外,它还能够减少10%~25%的一级程序Cache读访问,从而降低了处理器的功耗。
- 万江华陈书明
- 关键词:同时多线程超长指令字
- 先进微处理器体系结构及其发展趋势被引量:17
- 2007年
- 为了进一步提高微处理器性能,提出了多种新颖的体系结构,如多核、流处理、PIM、可重构、多态等。这些新的体系结构从不同角度对微处理器发展中的问题提出了解决方法。概述了这些体系结构的特点,并对未来体系结构的发展趋势进行了预测。
- 刘必慰陈书明汪东
- 关键词:体系结构微处理器
- MOSI:一种基于超长指令字处理器的同时多线程微体系结构被引量:1
- 2006年
- 描述了一种基于超长指令字处理器的同时多线程微体系结构———MOSI(MultiOp Splitting Issue,多操作①分离发射).MOSI动态地发射同一多操作内的指令,并通过写回缓冲保证计算结果的写回顺序与编译器的视图一致,从而以较小的代价解决了SMT技术中的关键问题.文中详细描述了写回缓冲的结构及算法,给出了多个线程的硬件模型,最后对硬件支持线程的个数及Cache的组织结构进行了讨论.实验结果表明,基于MOSI结构的双线程处理器能够将吞吐率提高40%.
- 万江华陈书明
- 关键词:同时多线程超长指令字多操作
- 奇异数据类型的编译支持被引量:1
- 2007年
- 专用处理器,如DSP等,因主要支持特定应用,其指令集往往只支持有限的数据类型。在采用高级语言为其编程时,若采用了处理器不支持的奇异数据类型,编译器必须在保持语义的前提下将其转化为处理器支持的一段指令。该文提出了一种在VLIW DSP编译器中实现对奇异数据类型的处理的方法,包括对含有奇异数据类型的中间代码的注释、调度依赖关系的计算、寄存器分配的改进。该类方法对编译器的改动相对较小,效率较高。
- 胡定磊陈书明刘春林
- 关键词:数据类型数据依赖关系寄存器分配编译器
- 全定制模块视图的产生与IP封装
- 2005年
- 文章首先说明了将全定制模块用在基于标准单元综合流程中、以及进行硬核IP封装时需要提交的模型与数据。详细分析了模块视图产生的方法、插值算法、Synopsys模型中查找表的跳变时间与负载电容索引点的合理取值、以及全定制模块特征值的类型及提取原理。最后,介绍了“银河飞腾—D4”高性能DSP中的全定制设计模块———桶形移位器与寄存器文件———的视图产生过程。
- 徐慧陈书明李振涛
- 关键词:全定制设计插值算法查找表