姚平
- 作品数:6 被引量:18H指数:1
- 供职机构:中国科学技术大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术自然科学总论更多>>
- 分片式流处理器上存储系统的设计与实现被引量:1
- 2010年
- 针对"存储墙"问题,从提高片外带宽使用率的角度出发,为分片式流处理器设计实现数据并行存储系统。该存储系统通过多级调度能有效减少片外访存的次数,降低片外带宽的需求。软件模拟和仿真验证的结果表明,在不同工作负载特征下,通过设计参数的优化选择,该设计能够充分挖掘存储访问的行局部性和体间并行性,从而提高带宽的使用效率。
- 汪芳安虹徐光许牧姚平
- 面向应用的流存储系统评测与改进
- 2010年
- 有限的片外存储带宽是制约流处理器性能提升的瓶颈之一,流存储系统已经采用了多种方式来缓解这个问题,但当前的设计并没有充分考虑应用具体的访存模式对有效带宽利用率的影响.通过分析和实验,评估流存储系统主要设计参数对不同访存模式的优化效果;在此基础上针对不同的流访问并行度提出了相应的结构改进,加入宽发射和短作业优先调度支持,充分挖掘存储访问的局部性和并行性,改善了负载平衡,从而有效地提高了片外带宽的使用效率和流程序的整体性能.
- 汪芳安虹徐光许牧姚平
- 关键词:DRAM
- 重要对称分组密码在流处理器上的实现
- 采用流体系结构的处理器Imagine在媒体应用,数字信号处理,科学计算等领域表现优秀,但其在信息安全领域的表现还未有评估.信息安全领域要求尽可快的对信息进行加解密,因此,缩短加解密算法的执行时间有重大意义。
本...
- 姚平安虹许牧刘谷
- 关键词:流处理器流编程模型分组密码信息安全
- 文献传递
- 基于主辅数据结构的CPU-GPU合作计算方法
- 本发明的实施例提出了一种基于主辅数据结构的CPU-GPU合作计算方法,包括以下步骤:根据处理的对象,确定主辅数据内容并进行初始化;启动CPU计算线程和GPU计算线程;读入待处理的数据,经过预处理后存储至主辅数据结构中,同...
- 安虹姚平刘谷徐光许牧李小强韩文廷张倩徐恒阳
- 文献传递
- CUDA平台上的CPU/GPU异步计算模式
- 计算统一设备架构(CUDA,Compute Unified Device Architecture)开启了使用GPU强大计算能力做通用计算的大门,使得开发者能够在友好的开发环境中充分挖掘GPU的计算能力,同时也对CPU/...
- 姚平
- 关键词:CUDA平台负载平衡
- 文献传递
- 一种类数据流驱动的分片式流处理器体系结构及其编程模型被引量:1
- 2010年
- 考虑到半导体工艺发展带来的线延迟问题,分布式、分片式的处理器结构变得很有吸引力.在传统流处理器中,流控制器发射的控制信号在传递时存在长线延迟问题.传统流处理器的运算簇由众多的功能部件组成,由于运算簇间的通信是集中控制的,运算簇间通信网络的线延迟可扩展性差.提出了一种分片式流处理器(TPA-PD)体系结构,它采用分布式的网络连接分片式的部件,避免了控制信号在传递过程中出现的长线延迟问题.在kernel级,TPA-PD使用类数据流的执行模型即显式数据流图执行,将指令间的依赖关系在指令中静态编码,把传统流处理器中运算簇间的集中通信变为动态发射、分布式的通信,利于结构扩展.解释了新的执行模型、指令集以及将流编程模型映射到新结构上.在时钟精确的模拟器上,实验分析了影响kernel级执行时间的软硬件因素,TPA-PD比传统流处理器在8个benchmark中平均获得了20%的加速比.
- 徐光安虹许牧刘谷姚平任永青汪芳
- 关键词:流处理器处理器结构