公共文化服务平台

涵盖I/O的广义存储一致性模型被引量：2: 2010年; 作为计算机体系结构核心问题之一的存储一致性研究主要是围绕CPU访存一致性问题展开的,I/O设备DMA操作引发的存储一致性问题则一直处于研究的边缘。从I/O与存储体系结构一体化设计理念出发,针对支持全局DMA访问的分布共享存储(DSM)系统存储一致性问题,研究广义存储一致性,定义了涵盖I/O的广义程序概念,建立了广义域存储一致性模型,研究了基于广义域存储一致性模型的Cache-Memory-I/O一致性协议实现技术,对于DSM系统实现全局共享I/O具有指导意义和参考价值。; 李琼邓明堂杨学军

基于事务存储的事务级线程切换被引量：1: 2009年; 针对目前TM系统将现有操作系统优化以提供良好的事务支持,研究基于LogTM系统的事务级线程切换,通过分析现有结构和修改操作系统的相关模块信息,为事务级线程切换提供支持,使事务化线程能够在操作系统调度下高效运行。; 张铎唐玉华所光; 关键词：事务存储体系结构操作系统上下文切换

非平衡进程到达模式下MPI广播的性能优化方法被引量：4: 2011年; 为了提高非平衡进程到达(unbalanced process arrival,简称UPA)模式下MPI广播的性能,对UPA模式下的广播问题进行了理论分析,证明了在多核集群环境中通过节点内多个MPI进程的竞争可以有效减少UPA对MPI广播性能的影响,并在此基础上提出了一种新的优化方法,即竞争式流水化方法(competitive and pipelined method,简称CP).CP方法通过一种节点内进程竞争机制在广播过程中尽早启动节点间通信,经该方法优化的广播算法利用共享内存在节点内通信,利用由竞争机制产生的引导进程执行原算法在节点间通信.并且,该方法使节点间通信和节点内通信以流水方式重叠执行,能够有效利用集群系统各节点的多核优势,减少了MPI广播受UPA的影响,提高了性能.为了验证CP方法的有效性,基于此方法优化了3种典型的MPI广播算法,分别适用于不同消息长度的广播.在真实系统中,通过微基准测试和两个实际的应用程序对CP广播进行了性能评价,结果表明,该方法能够有效地提高传统广播算法在UPA模式下的性能.在应用程序的负载测试实验结果中,CP广播的性能较流水化广播的性能提高约16%,较MVAPICH21.2中广播的性能提高18%～24%.; 刘志强宋君强卢风顺徐芬; 关键词：MPI 集合通信

CACC:一种基于分簇的自适应网络坐标计算方法: 针对Internet环境中采用基于坐标的方法预测网络节点间的距离问题,提出了一种基于分簇的自适应网络坐标计算方法CACC.首先,提出了E-Binning分簇算法,并在此基础上通过比较不同的地标选择策略,CACC采用了最优...; 李小勇王意洁; 关键词：网络坐标覆盖网拓扑感知; 文献传递

面向CC-NUMA体系结构的事务内存冲突规避方法被引量：1: 2011年; 现有的事务内存研究主要面向多核处理器和SMP机器,缺少对CC-NUMA系统的研究.而CC-NUMA是高端服务器的重要体系结构,随着用户对并行处理能力需求的不断上升,高端服务器将占据越来越重要的地位.文中概要阐述事务内存研究的基本情况,通过详尽的实验数据,深入分析了CC-NUMA结构的本地、远程访存差异特性对事务内存性能的影响,提出了一种面向CC-NUMA体系结构的冲突规避方法PBC.PBC在事务启动之前,对冲突可能性进行预测,并根据预测结果对事务进行调度,以降低事务的失败率.实验表明,文中提出的PBC方法可以显著提高CC-NUMA机器上运行事务内存的整体性能.; 王睿伯卢锡城卢凯王绍刚; 关键词：事务内存 CC-NUMA

A coarse-grained reconfigurable computing architecture with loop self-pipelining: 2009年; Reconfigurable computing tries to achieve the balance between high efficiency of custom computing and flexibility of general-purpose computing. This paper presents the implementation techniques in LEAP, a coarse-grained reconfigurable array, and proposes a speculative execution mechanism for dynamic loop scheduling with the goal of one iteration per cycle and implementation techniques to support decoupling synchronization between the token generator and the collector. This paper also in- troduces the techniques of exploiting both data dependences of intra- and inter-iteration, with the help of two instructions for special data reuses in the loop-carried dependences. The experimental results show that the number of memory accesses reaches on average 3% of an RISC processor simulator with no memory optimization. In a practical image matching application, LEAP architecture achieves about 34 times of speedup in execution cycles, compared with general-purpose processors.; DOU Yong WU GuiMing XU dinHui ZHOU XingMing

事务存储结构的实现被引量：1: 2008年; 多核处理技术将成为计算机的主流技术,基于多核开发线程级并行已至关重要,事务的引入能够解决目前线程所不能完成的功能,同时能够简化编程模型,事务存储能很好地实现事务特性。本文首先介绍了TM的基本原理,接着分析了目前主流TM系统LogTM,着重于数据版本管理和冲突管理机制的实现,进而将此系统的优越性展现出来。最后对本文进行了总结和展望。; 张铎唐玉华所光; 关键词：事务存储体系结构操作系统

面向大规模MPI程序的应用级checkpointing技术: 应用级checkpointing是一种在大规模科学计算领域中备受关注的容错技术.但是应用级checkpointing技术要求用户决定哪些是需要保存的关键数据,这增加了用户的负担.介绍一个基于MPI并行程序活跃变量分析的源...; 王攀峰杜云飞周海芳杨学军; 关键词：容错 MPI程序; 文献传递

集群上软件事务内存的层次化冲突检测: 2009年; 大多数事务内存研究都在多核处理器上进行,只有少数研究针对集群计算环境。现有的集群事务内存性能较差,因为事务内存的运行需要进行大量的远程内存访问,而集群的内存分布性使得远程内存访问的性能较差。事务内存运行中的冲突检测是进行远程内存访问最多的操作。我们提出了一种层次化的冲突检测方法,将其分为两个步骤进行,这种层次化的策略可以使集群上的软件事务内存获得高性能。; 王睿伯卢凯卢锡城; 关键词：事务内存

大容量软件管理片上存储器分配技术综述被引量：2: 2009年; 在现代计算机体系结构中,对于大容量的片上存储器,越来越多地采用软件来管理,被认为是解决存储墙问题的一个有效途径。本文介绍了片上大容量软件管理存储器分配技术的研究进展,对有代表性的技术进行了概要的介绍和评述,并预测了技术的发展方向。; 汪黎

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

国家自然科学基金(60621003)