您的位置: 专家智库 > >

赵博

作品数:7 被引量:9H指数:2
供职机构:解放军信息工程大学更多>>
发文基金:国家科技重大专项国家重点实验室开放基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 6篇期刊文章
  • 1篇学位论文

领域

  • 7篇自动化与计算...

主题

  • 3篇向量
  • 3篇向量化
  • 2篇多核
  • 2篇多核处理
  • 2篇多核处理器
  • 2篇异构
  • 2篇异构多核
  • 2篇异构多核处理...
  • 2篇自动并行化
  • 2篇面向异构
  • 2篇并行化
  • 2篇处理器
  • 1篇代码
  • 1篇单指令多数据
  • 1篇调优
  • 1篇虚拟化
  • 1篇数据传输
  • 1篇数据重用
  • 1篇数据重组
  • 1篇统一架构

机构

  • 7篇解放军信息工...
  • 1篇中国人民解放...

作者

  • 7篇赵博
  • 5篇赵荣彩
  • 4篇高伟
  • 3篇李雁冰
  • 1篇黄品丰
  • 1篇丁锐
  • 1篇徐金龙
  • 1篇刘鹏
  • 1篇高伟

传媒

  • 3篇计算机科学
  • 2篇信息工程大学...
  • 1篇计算机工程与...

年份

  • 3篇2015
  • 3篇2014
  • 1篇2013
7 条 记 录,以下是 1-7
排序方式:
类型转换语句的SLP发掘方法被引量:2
2014年
多媒体技术的迅速发展使得越来越多的处理器集成了SIMD扩展,当前的编译器大多数都已实现了自动向量化功能。为了发掘迭代内并行,一些编译器在自动向量化模块中引入了SLP向量化方法。多媒体数据的密集存储和规则运算使得在处理多媒体数据时需要进行频繁的数据类型转换,而目前的SLP向量化方法对数据类型转换的处理能力还不完善。为了在存在大量数据类型转换语句的程序中发掘更多的SLP向量化机会,提出了一种类型转换语句的SLP发掘方法,它能够在SLP向量化框架下利用数据重组实现具有相同向量化因子和不同向量化因子的数据类型之间的转换。实验结果表明,该方法能够有效地对类型转换语句进行SLP向量化发掘,提高了程序的向量化执行效率。
赵博赵荣彩李雁冰高伟
关键词:数据重组SLPSIMD
基于虚拟指令的向量化方法及优化技术研究
赵博
面向异构多核处理器的的循环分块被引量:4
2015年
将OpenACC编程模型用于异构多核处理器时,由于异构多核处理器加速设备内存有限,操作大量数据的代码不能获得很好的加速。针对这一问题,在OpenACC中引入循环分块子句,对循环进行分块处理,使每个循环块使用的数据能够存储在设备内存中;提出面向异构多核处理器的循环分块子句生成算法,并在基于Open64的"源-源"自动并行化系统Auto-ACC中进行实现。测试结果表明,在异构多核处理器上,扩展的循环分块子句及所提生成算法能够对程序进行明显的加速。
李雁冰赵荣彩赵博黄品丰
关键词:异构多核处理器数据重用自动并行化
Open64源源翻译流程研究被引量:2
2013年
源源翻译是一种有用的编译基础设施,它将高级语言程序转换为语义等价的可再编译的高级语言程序。越来越多的编译器包含源源翻译模块。和其它模块相比,Open64源源翻译模块还不够健壮。为了更好地解决源源翻译过程中出现的问题,首先研究了Open64的中间表示whirl,然后研究了Open64的源源翻译流程,最后通过测试说明源源翻译的重要性。
高伟李骁赵博
一种面向SIMD扩展部件的向量化统一架构
2014年
随着多媒体应用的普及和高性能计算的需求,越来越多的处理器集成了SIMD扩展。为了针对不同SIMD扩展部件自动生成高效的向量化代码,设计了一套虚拟向量指令集,在此基础上构建了一种面向SIMD扩展部件的向量化统一架构。将输入程序通过向量识别等阶段转变为虚拟向量指令的中间表示,而后通过向量长度解虚拟化和指令集解虚拟化,将其转变为特定SIMD部件的向量指令集。在申威1600、DSP和Alpha上的实验结果表明:统一架构能够针对3种平台自动变换出高效的向量化代码,在DSP上的加速比要明显优于其它两种平台。
刘鹏赵荣彩赵博高伟
关键词:向量化单指令多数据
渐进式智能回溯向量化代码调优方法
2015年
为了充分发挥高性能计算机的计算能力,缓解程序员设计和编写并行程序的压力,扩充可用软件集合,设计并实现了利用交互界面深入挖掘程序中的可向量化语句,优化生成代码中的向量化语句,提高生成代码的执行效率。该方法对充分发挥高性能计算机的计算能力,增强系统可用性和扩展应用范围具有重要的意义,同时能够提供有效的辅助手段和工具支持。渐进式智能回溯向量化代码调优架构通过对用户提交的串行程序进行程序分析和变换,采用串行程序分析、数据依赖分析、向量化分析等技术手段,根据分析结果对程序进行变换和优化,自动生成最终的向量化代码。该方法通过分析串行程序中潜在的并行性,将其自动变换为等价的向量化代码形式,大大简化了程序员的工作。
赵博赵荣彩徐金龙高伟
面向异构多核处理器的分块交叉数据传输被引量:1
2015年
由于异构多核处理器中加速设备内存有限,在进行加速计算时往往需要把主存中的数据分块传输到设备内存。Open ACC现有的数据拷贝子句不支持数据的分块传输,为此对Open ACC的数据拷贝子句进行扩展,引入分块规则数组区域表示方式,用于实现数据的分块交叉传输。分块交叉传输能够使加速器所需数据精确地拷贝到其设备内存,提高了设备内存的利用率和减少了不必要的数据传输。并在基于Open64的"源-源"自动并行化系统autoACC中,实现了扩展数据拷贝子句的自动生成。测试结果表明,在异构多核处理器上,扩展的数据拷贝子句及提出的扩展数据拷贝子句生成方法是有效的,能够对程序进行有效加速。
李雁冰赵荣彩丁锐赵博
关键词:异构多核处理器ACC自动并行化
共1页<1>
聚类工具0