国家教育部博士点基金(20069998025)
- 作品数:11 被引量:15H指数:3
- 相关作者:张春元伍楠文梅何义任巨更多>>
- 相关机构:国防科学技术大学中国人民解放军海军指挥学院更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 图形处理器的流执行模型
- 2008年
- 图形处理器极高的流计算能力使其成为实现实时流应用的有效方案。该文抽象出图形处理器的流执行模型,描述图形处理器流处理机制的执行过程,在图形处理器上实现了二维离散余弦变换。实验结果表明,图形处理器对标清格式的视频压缩编码效率可达70 fps。
- 李海燕张春元李礼任巨
- 关键词:图形处理器
- 流处理器MASA-I在FPGA上的实现被引量:5
- 2008年
- 流处理器与传统微处理器相比具有更高的性能和效率,已广泛应用于图像处理、媒体处理等领域。本文基于Altera EP2S180 FPGA芯片设计并实现了一款32位异构多核流处理器MASA-I,并对其硬件开销及性能进行了评估。结果表明,基于流处理的异构多核系统能够在FPGA上较好地实现,满足了流应用的需求。
- 杨乾明伍楠何义荀长庆张春元
- 关键词:流处理器FPGAMPEG
- 流体系结构技术发展探讨被引量:3
- 2009年
- 以流计算模型为基础的流体系结构,是面向未来的单片上集成超10亿只晶体管和上千ALU时代的新型体系结构,正成为微处理器体系结构研究关注的前沿焦点之一。首先分析流计算的背景;总结现有的具有代表性的流体系结构,并对它们的结构、执行模式、并行性、片上存储使用方式和应用目标等方面进行了比较;然后归纳流程序设计及其环境,讨论当前流编译研究的热点方向;最后探讨流处理器设计的发展趋势。
- 张春元文梅伍楠任巨管茂林何义
- 关键词:流处理器体系结构
- 梅森素数并行求解算法的流式实现被引量:3
- 2007年
- 本文以数论中的Lucas-Lehmer检验法为基础,提出了梅森素数并行求解算法在FT64流处理器上的流式实现,并通过重设流记录的大小对程序进行了优化。评测数据表明,在FT64上运行该应用的时间平均比1.5GHz Itanium2快2.5倍。本文为梅森素数求解问题寻找了一条可行的加速方法,同时证实了流体系结构在高性能计算领域的极大潜力。本文提出的流式算法以及各种优化手段,对于其他科学计算领域中的计算密集型问题在流体系结构上的映射有极大的借鉴意义。
- 伍楠吴伟文梅杨乾明柴俊张春元
- 关键词:流体系结构梅森素数流处理器
- 基于流体系结构的帧内预测算法优化设计
- 2010年
- 为高效实现H.264多模式帧内预测,解决其计算复杂度高造成的计算压力,本文根据H.264帧内预测算法的计算密集与数据并行的特征,基于流处理执行模型提出适用于Imagine流体系结构的分组帧内预测流算法,并采用长流分段技术进行优化设计.实验结果表明,H.264帧内编码器流实现对1280×720高清视频编码帧率达45.9fps,满足实时性需求.
- 李海燕张春元付剑
- 关键词:视频编码H.264帧内预测
- 面向高性能计算的流VLIW编译技术研究被引量:1
- 2008年
- 本文基于斯坦福大学设计的KernelC编译器ISCD[1],针对64位流处理器体系结构,设计实现了其核心VLIW编译器,并针对高性能计算应用需求进行优化,实现了分布式寄存器负载均衡和指令自动合并技术。实验结果表明,该编译器能够很好地开发程序中的并行性,具有较高的效率。
- 管茂林伍楠文梅吴伟柴俊张春元
- 关键词:流处理器VLIW
- 一种面向分布式寄存器文件的VLIW调度新策略被引量:2
- 2008年
- 新一代面向密集计算的高性能处理器普遍采用分布式寄存器文件来支撑ALU阵列,并通过VLIW开发指令级并行。面向分布式寄存器文件的编译成为新兴的研究热点,在斯坦福大学的kernelC编译器ISCD中最早提出了面向分布式寄存器的VLIW调度问题,在该领域处于领先水平,但是没有解决重负载下的分布式寄存器分配问题,使应用编程受到极大限制。在其基础上提出了一种新的VLIW调度策略,实验结果表明能够很好地解决重负载下的分布式寄存器分配问题。
- 伍楠文梅张春元
- 关键词:寄存器分配VLIW
- 多维可扩展流体系结构研究与评测被引量:5
- 2008年
- MASA(Multiple-dimension scalable Stream Architecture)是一种可在多个维度扩展的流体系结构.本文对该体系结构的扩展性进行了深入探讨,分析了簇内、簇间和多核扩展的VLSI资源开销,并通过一组测试程序评测了MASA的性能.结果表明,三个扩展维度形成有利互补,使得MASA流体系结构可支持扩展到单片内集成上千个ALU.
- 吴伟文梅伍楠何义杨乾明管茂林荀长庆任巨柴俊张春元
- 关键词:流处理器流体系结构扩展性并行处理
- 一种流体系结构中软硬结合的异构核协同方法被引量:4
- 2008年
- 在流体系结构中,标量核同流处理核是异构核,它们之间的协同是流处理器能够正确、高效运转的基础.文中针对异构核间所采用的软件协同方法性能低的问题,提出了一种软件和硬件相结合的异构核协同方法,并基于MASA-I流处理SOPC系统进行了实现.使用媒体和数字信号处理领域核心算法进行测试的结果表明,与软件协同方法相比,使用文中方法的协同性能有2个量级的提升,程序整体性能提高一倍.
- 任巨何义荀长庆杨乾明文梅伍楠张春元
- 关键词:流处理器体系结构
- 实时高清H.264编码中CAVLC的流式实现
- 2009年
- CAVLC是H.264中熵编码的一种重要实现方式,具有可挖掘的数据级并行特征,但同时具有较强的串行特点。本文分析了CAVLC的程序特征,提出了CAVLC的流式实现方法,并在流处理器STORM-1上进行了实现。实验结果表明本方法能够满足实时高清H.264编码的性能需求。
- 任巨何义吴伟张春元
- 关键词:CAVLC