您的位置: 专家智库 > >

黄其军

作品数:6 被引量:4H指数:1
供职机构:北京大学信息科学技术学院计算机科学技术系更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇期刊文章
  • 2篇学位论文

领域

  • 6篇自动化与计算...

主题

  • 2篇数据并行
  • 2篇编译器
  • 2篇并行计算
  • 1篇英文
  • 1篇优化技术
  • 1篇数据并行语言
  • 1篇数据相关
  • 1篇数据重用
  • 1篇网络
  • 1篇网络并行
  • 1篇网络并行计算
  • 1篇基于网络
  • 1篇编译优化技术
  • 1篇HPF
  • 1篇HPF编译器
  • 1篇INDEPE...
  • 1篇并行语言
  • 1篇P

机构

  • 6篇北京大学
  • 1篇清华大学

作者

  • 6篇黄其军
  • 4篇许卓群
  • 3篇丁文魁
  • 3篇余华山
  • 1篇胡长军
  • 1篇丁阳
  • 1篇向华
  • 1篇杨建武

传媒

  • 3篇软件学报
  • 1篇计算机科学

年份

  • 1篇2003
  • 3篇2002
  • 1篇2001
  • 1篇1999
6 条 记 录,以下是 1-6
排序方式:
一个用于数据并行语言计算划分的时序优化模型(英文)被引量:2
2001年
一个程序中数据并行语句的计算划分 (CP)对该程序的运行性能有决定性的作用 .尽管人们对这一问题已经进行了广泛的研究 ,但这些研究的重点都集中在如何提高被选择计算划分的空间局部性上 .针对并行循环结构的计算划分问题 ,提出了一个时序优化模型 .在该模型中 ,一个计算划分被表示成一个有向图 ,在把并行语句中的操作映射到各个处理器的同时 ,给出了被分配到不同处理器上的操作之间的相关性 .对于一条数据并行语句 ,时序优化模型对它的每个计算划分选择方案分别采用多种有效的优化策略进行优化 ;并综合考虑各个计算划分选择方案的负载平衡性、处理器间的操作依赖性、数据访问的空间局部性和时间局部性四个方面的因素 ,估算每个方案的执行效率 ;最后从这些方案中选择一个执行效率最优的方案作为该语句的计算划分 .作者已在 HPF编译器 p-HPF采用时序优化模型实现了对 FORAL L结构的支持 .实验结果表明 ,该模型具有非常好的通用性 ,对不同领域多种数据并行问题均取得了理想的加速比 .同时 ,只需略微改动 ,该模型也可用于其他类型数据并行语句的计算划分 .
余华山胡长军黄其军丁文魁许卓群
关键词:数据相关数据重用数据并行语言
p_HPF编译系统中Independent do语句的研究与实现
该文首先介绍了HPF语言的特点,并介绍了p_HPF的编译模型:通过源到源的编译变换,将HPF源程序变换为一种以FORTRAN77为目标语言的结点程序,该程序是基于消息传递的SPMD程序.同时,介绍了编译系统的整体结构,包...
黄其军
关键词:数据并行
文献传递
基于规范划分集的并行循环计算划分被引量:1
2003年
计算划分问题是并行编译中最为重要的问题之一.针对并行循环,在数据分布确定的情况下,提出了基于规范集的计算划分算法,具体讨论了规范集的获取方法及综合通信与负载均衡的最优方案选取算法.实验表明,在并行循环处理方面,这一算法与以前几种算法相比更加简单、有效;采用这一算法的p_HPF编译器对数据并行应用问题可以获得良好的加速比和效率.该编译器已在石油领域得到应用.
黄其军杨建武余华山许卓群
基于网络的数据并行计算中分布数组描述研究被引量:1
2002年
如何描述分布数组是基于网络数据并行计算的基本问题.从网络并行计算的一般需求出发,讨论了分布数组描述DAD(distributed array descriptor)的内容和结构,具体给出了p-HPF并行编译系统的DAD结构定义.针对分布数据的稀疏存储和紧凑存储模型,给出了数据在Block分布、Cyclic分布和Block_Cyclic(k)分布方式下,全局数组到局部数组转换的计算方法,这些方法已在p-HPF编译器中得到实现并证明了其有效性.最后讨论了分布数据描述的标准化对实现并行计算系统的可移植性和可重用性的意义.
胡长军丁文魁黄其军向华许卓群
关键词:网络并行计算
并行循环及其编译优化技术
日新月异的计算机软硬件技术为并行计算的发展带来了机遇,并行编程语言及其编译技术的研究与开发与因此成为当前并行计算技术的重点发展方向之一.在这种背景下,我们开展了数据并行语言编译技术的研究工作,并已成功的开发出一个HPF并...
黄其军
关键词:并行计算
基于规范划分集的并行循环编译框架
2002年
Compilation of parallel loops is one of the most important parts in parallel compilation and optimization. This paper mainly discusses the key techniques during the compilation implementation of parallel loops, based on the uniform partition schemes. It includes techniques in local array index generating, loop space reconstructing, communication detecting and organizing and data dependence disposing. The efficiency of this implementation has been proved by lots of experiments. The p_HPF compiler which adopts this compiling framework can obtain good speedups and efficiencies. The compiler has been applied in many fields, particularly the field of petroleum exploration.
黄其军丁阳余华山丁文魁许卓群
关键词:编译器
共1页<1>
聚类工具0