国家自然科学基金(69933020) 作品数:41 被引量:305 H指数:10 相关作者: 郑纬民 张兆庆 舒继武 沈美明 乔香珍 更多>> 相关机构: 中国科学院 清华大学 国家自然科学基金委员会 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 国家重点基础研究发展计划 更多>> 相关领域: 自动化与计算机技术 电子电信 电气工程 石油与天然气工程 更多>>
一种实用的互联网络拓扑结构RP(k)及路由算法 被引量:24 2002年 提出了一种基于Petersen图的互联网络RP(k),研究了该互联网络的性质,它具有良好的连接度、短的直径和简单的拓扑结构.在节点小于300的情况下,RP(k)的直径低于Torus的直径,其最优分组的距离小于Torus最优分组的距离,特别是当分组节点数m满足6≤m≤100时,RP(k)最优分组的距离近似等于Torus最优分组距离的一半.基于Petersen图结构,设计了点点通信、置换路由、广播路由和多对多路由算法,它们的通信效率分别为[k/2]+2,k+5,[k/2]+2和k+5. 刘方爱 乔香珍 刘志勇关键词:拓扑结构 PETERSEN图 网络直径 路由算法 一种异步BSP模型及其程序优化技术 被引量:9 2002年 基于 BSP模型 ,该文提出了异步计算模型 (CSA- BSP) .该模型更准确地描述了并行机的性能参数 ,引导用户编写高效率的并行程序 ;在 CSA- BSP模型下 ,两个进程异步执行的位置至多相差 p- 1个超步 ;基于程序的执行时间 ,作者分析了 BSP、A- BSP和 CSA- BSP程序的效率 ,得出 CSA - BSP程序的效率是最高的 .在曙光并行机上 ,用“红黑格法”和“矩阵乘法”进行了验证 ,和 BSP模型相比 ,这两个 CSA- BSP程序的效率分别提高 2 0 %和 37% ;同时 ,其进程执行时间的和最大可以降低 8% .因此 ,按照 CSA- BSP模型编程对于提高程序效率和改善系统的吞吐率 ,都有良好的效果 . 刘方爱 刘志勇 乔香珍关键词:并行计算模型 性能分析 并行计算机 ORC的代码生成的关键技术 2004年 处理机的指令级并行能力只有通过编译器才得以发挥。代码生成是编译器后端中直接针对目标处理机的优化阶段的集合,因而它是提高目标处理机指令级并行的重要组成部分。ORC(Open Research Compiler)是一款针对IA-64体系结构的开放源码编译器,它具有丰富的优化阶段和良好的性能。本文介绍了 ORC 的代码生成的关键技术,这些技术包括区域构造、谓词相关优化、全局指令调度、参数化的机器描述以及微调度。实测结果表明,这些技术取得了显著的优化结果,ORC 相对于 Pro64能取得平均23%的加速比。 薛丽萍 张兆庆关键词:ORC 代码生成 IA-64体系结构 编译器 大规模薄膜生长的格子MC模拟并行计算 被引量:1 2002年 基于1000×1000个原子的Ti薄膜淀积生长过程的模拟,在分布式并行系统上提出了区域重叠划分和异步通信的有效并行计算策略,并运用 Monte Carlo方法实现了模拟真实沉积速率下的大规模薄膜生长的并行计算过程,缩短了薄膜生长模拟计算时间.实现的并行算法能够模拟比以前粒子数大得多的真实沉积速率下薄膜生长问题,从而为运用计算机方法模拟薄膜生长提供了有效的手段. 舒继武 郑纬民 H.C.Huang W.O.Wong关键词:薄膜生长 并行计算 MONTE CARLO方法 沉积速率 计算机模拟 Unix进程文件系统及其在调试器设计中的应用 被引量:6 2004年 进程文件系统比传统的ptrace系统调用具有效率高、功能强的优点,该文介绍了它的主要功能,并以调试器的设计为例,详细描述了进程文件系统的应用情况。 刘建 沈美明关键词:调试器 UNIX 编译器中多视图中间表示的支撑技术 被引量:2 2002年 中间表示是构造优化编译器的核心技术 ,其设计方式对整个编译器的可适应性影响很大 .IR的扩充和改进往往引起整个编译器全局性的修改 .而体系结构的修改、某些编译优化模块的改进都会引起 IR的扩充或修改 ,这使得整个编译器的适应性很差 .介绍了一种多视图低层中间表示 ,通过向编译器的不同部分提供不同视图 ,以及逻辑视图到物理视图的映射 ,隐藏中间表示的实现细节 ,提高了编译器各优化分析模块算法的抽象层次 。 傅忱 张兆庆关键词:多视图 编译器 可适应性 一个并行程序集成开发环境的功能框架及实现中的关键技术 被引量:2 2001年 高性能 ,高可靠性和良好的可扩展性使得机群系统的应用领域日益广泛 ,但是目前缺乏一个方便实用的并行程序开发环境 .本文首先从方便程序员开发并行程序的角度提出了一个并行程序集成开发环境的功能框架 ,然后重点论述了在实现集成开发环境时涉及到的一些关键问题和技术 ,最后简要介绍了基于这些技术的 IPCE2 . 赵刚 沈美明 郑纬民关键词:集成开发环境 机群系统 构造并行化系统交互环境的若干关键技术 被引量:6 2001年 交互式并行化系统通过提供友好的交互功能并引入用户知识来协助程序的并行化 ,是解决自动并行化能力不足的一条有效途径 .描述了一个并行化系统交互环境 TIPSIE(interactive environment of Tsinghua interac-tive parallelizing system) ,并就构造该环境的性能预测、增量编译和数据相关查询等关键技术进行了讨论 .实验结果表明 。 杨博 王鼎兴 郑纬民一种基于检查点的并行程序调试器的设计与实现 被引量:13 2002年 为支持大规模长时间运行并行程序的调试 ,有必要将检查点机制引入到并行程序调试器中 .检查点设置与卷回应用中需要解决中途消息、孤儿消息和多米诺效应、活锁 4个问题 ;并行程序调试中需要解决不确定性问题 .提出的基于状态冻结的确定性检查点设置方法 ,可以避免检查点应用中孤儿消息和多米诺效应、活锁 3个问题 ,通过消息记录的方法处理中途消息问题 ;采用记录 /重放方法解决并行调试中的不确定性问题 .基于状态冻结的确定性检查点设置方法 ,有效地解决了并行程序调试器和检查点结合时产生的诸多问题 .该方法具有结构清晰、易于实现的优点 .基于此技术 ,设计并实现了一个并行调试工具—— DENNET. 刘建 汪东升 沈美明 郑纬民关键词:检查点 一种适用于有限差分模式的负载平衡区域分解方法 被引量:10 2002年 分布式内存并行处理在数值天气预报等超大规模科学计算中已经得到了广泛的应用。中尺度模式由于分辨率高 ,计算量大 ,需使用更多的处理机进行并行运算。另一方面 ,由于复杂的物理过程的采用 ,增加了不同天气的计算量的不平衡。但是 ,目前所广泛使用的并行处理方法在处理机数量较多时不能很好地均衡计算负载 ,引起并行计算效率的降低。本文提出了一种新的非规则区域分解负载分配方法。并与已有的负载分配方法进行了分析试验对比 ,该方法能更有效地平衡负载 。 金之雁 王鼎兴关键词:负载平衡 处理机 数值天气预报 中尺度模式 有限差分