张延军 作品数:12 被引量:7 H指数:2 供职机构: 清华大学 更多>> 发文基金: 国家自然科学基金 国家教育部博士点基金 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
寄存器堆互连的VLIW结构及其指令调度算法 2008年 超长指令字(Very Long Instruction Word,VLIW)处理器一般采用总线互连的多簇结构,每个簇中的功能单元共享一个本地寄存器堆,簇间采用总线传输数据,以避免功能单元增多时,全连通结构的延时、面积和功耗的快速增长;但簇间数据共享时的拷贝和延时,使得处理器在性能上有所下降.文中提出了一种寄存器堆互连的多簇VLIW结构,采用寄存器堆来连接各个簇,从而可以避免簇间数据传输的延时和额外的数据拷贝操作.同时也提出了针对这种结构的指令调度算法,以提高指令调度的性能.实验结果表明,与全连通的VLIW结构相比,寄存器堆互连结构在性能上仅有13%左右的性能下降,代码长度则基本不变;这都优于总线互连的多簇结构. 周志雄 何虎 杨旭 张延军 孙义和关键词:超长指令字 指令调度 寄存器堆 用于RFCC-VLIW结构的二维力量引导调度算法 2008年 多簇超长指令字处理器的簇间数据传输会将导致处理器性能下降。该文针对寄存器堆互连的多簇超长指令字(RFCC-VLIW)结构,提出一种新的二维力量引导调度算法,其力量表达式为以周期和簇为自变量的二维力量。实验结果表明,以RFCC-VLIW结构为目标,该二维力量引导调度算法优于现有的其他多簇超长指令字处理器的调度算法。 周志雄 何虎 张延军 杨旭 孙义和关键词:超长指令字 调度算法 用于分簇VLIW结构的二维力量引导簇调度算法 2008年 为了有效地减少分簇VLIW(very long instructionword)处理器结构中簇间数据传输带来的处理器IPC(instructions per-cycle,每周期指令数)的损失,提出了一种新的二维力量引导簇调度算法。该算法采用二维力量引导的方式,在进行簇分配的同时兼顾指令在各个周期上的调度,使指令在各个簇上的均衡分配,有效地产生更小的调度长度。时间复杂度方面,该算法仅为O(n2),优于PCC、模拟退火等循环提高算法;算法性能方面,实现结果表明,利用该算法对分簇VLIW结构进行簇调度,可获得比UAS(unifiedassignment and scheduling)算法更佳的处理器性能。 周志雄 何虎 张延军 杨旭 孙义和关键词:超长指令字 RFCC-VLIW:一种适用于超长指令字处理器的寄存器堆结构 被引量:1 2008年 为了解决超长指令字处理器中功能单元的增加会带来寄存器堆代价的急剧增长的问题,该文提出了一种新的寄存器堆结构。该结构采用分簇的方式将传统的单一寄存器堆化分成多个本地寄存器堆,每个寄存器堆对应一个功能单元簇,每个功能单元簇可以自由访问它对应的本地寄存器堆。同时该结构采用一个全局寄存器堆将所有功能单元簇互连以方便各个功能单元簇之间互相访问数据。寄存器堆的划分减少了寄存器堆的端口数量,有效降低了处理器中寄存器堆在面积、功耗、访问延时等方面的代价。全局寄存器堆的使用减少了分簇结构带来的数据复制操作,降低了分簇结构带来的处理器性能损失。试验结果证明,在降低寄存器堆代价的同时,该结构将处理器的平均性能损失降低到13%。 张延军 何虎 周志雄 孙义和关键词:超长指令字 一种面向视频标准应用的编解码器 本发明公开了属于视频通信领域的一种面向视频标准应用的编解码器。该编解码器是一个可配置超长指令THUMchip数字信号处理器核,包括指令存储器、指令读取单元、指令分发单元、可配置功能单元、全局寄存器堆、中断控制模块、控制状... 孙义和 张延军文献传递 CERCIS:一种视频媒体编解码片上系统的设计实现 被引量:1 2009年 基于面向特定应用的可配置处理器架构及其设计方法,设计并完成了一种视频媒体编解码片上系统芯片,它具有通用数字信号处理器的柔性编程及特定目标应用时的高性能等特点。该视频编解码片上系统由编码和解码2部分组成,编码和解码部分都采用相同的媒体信号处理架构。媒体信号处理编码、解码架构中分别包含一个8发射超长指令字数字信号处理器核,还包括实现视频媒体应用的专用数据传输单元,变长编解码单元以及接口单元,可以完成H.263视频媒体编码和解码。在0.13μm工艺库下模拟验证表明,该片上系统在17MH z工作频率下可完成15帧/s QC IF图像的H.263编码,在10MH z工作频率下可完成15帧/s QC IF图像的H.263解码。 沈钲 何虎 张延军 孙义和关键词:数字信号处理器 超长指令字 一种面向ASIP设计的可扩展的数字信号处理器结构 本文阐述了一种面向ASIP设计的可扩展的数字信号处理器结构以及面向这种结构的基于ORC的可重定向编译器.针对某一类具体应用,设计人员可以通过配置这种结构很方便地得到一个新的ASIP. 张延军 何虎 周志雄 杨旭 孙义和关键词:数字信号处理 电路设计 文献传递 一种可编程数字信号处理器的设计与实现 THDSP2005是采用改进型哈佛结构的定点可编程数字信号处理器,通过独立的程序和数据总线以及并行数值/逻辑单元实现高速数值/逻辑运算,同时它采用了专用指令系统,可以方便地实现复杂的数字信号处理算法.THDSP2005在... 沈钲 何虎 张延军 杨旭 谭洪贺 孙义和关键词:可编程数字信号处理器 流水线 片内存储器 文献传递 适用于VLIW数字信号处理器的功能验证策略 被引量:3 2007年 由于数字信号处理器结构的复杂性,对于数字信号处理器的验证一直是一个很大的挑战。构建一个基于模拟形式的数字信号处理器验证系统,该系统采用测试向量产生工具μGP产生高效率的验证向量,并将硬件设计的模拟结果与周期级精确的模拟器产生的结果进行比较来验证数字信号处理器的正确性。采用该平台对一个九级流水线的超长指令字结构数字信号处理器进行验证,可以在4000条指令内达到99%以上的代码语句覆盖率。 张延军 何虎 丁谢 雷庭 孙义和关键词:数字信号处理器 面向特定应用的指令集处理器设计方法研究 随着多媒体技术和通讯技术的飞速发展,多媒体视频数据应用对于处理器的性能提出了越来越高的要求,本课题针对该应用的未来需求,展开了流媒体处理的特定应用处理器结构的研究和设计。 论文提出了一种基于超长指令字结构的可配置处理器结... 张延军关键词:数字信号处理器 多媒体 文献传递