公共文化服务平台

一种基于RAM的降低异构多核切换开销的方法: 同一程序的不同执行阶段或者不同程序运行时行为特征不同.异构多核处理器包含多种类型处理器核,可以根据程序运行时的行为特征切换到性能、功耗合适的核.异构多核相对于同构多核处理器能够更好地满足性能和功耗要求,但是不同核间切换时...; 刘奇郝守青沈海华章隆兵; 关键词：寄存器重命名; 文献传递

基于消息的内存系统关键技术研究被引量：1: 2013年; 提出了一种基于异步的请求和应答消息的新型访存协议。相比于传统的同步总线式内存体系结构,可变粒度的访存提高了内存带宽的有效利用率,异步消息访问有利于内存容量的扩展。本文通过分析典型应用程序的访存行为评估了消息式内存可能带来的性能提升,并探讨了实现消息式内存所面临的挑战。; 陈明宇阮元黄永兵陈荔城崔泽汉陈明扬; 关键词：内存体系结构

边缘海静力数值预报模式并行算法研究: 2016年; 边缘海静力数值模式是国内针对边缘海特点自主开发的数值预报模式,但该模式因物理求解方程较多且采用不宜并行化的SOR求解算法而程序计算时间过长。针对上述问题,提出基于三维网格和海洋模式特点的SOR并行求解算法,该算法在保留三维网格数据间依赖关系的同时,有效解决了SOR迭代算法难以并行化的问题。同时,引入通信避免算法,采用MPI非阻塞通信方式,细分计算和通信过程,利用计算有效隐藏通信开销,提高了并行程序效率。实验结果表明,并行后的边缘海静力数值模式程序的性能相对串行程序提升了60.71倍,3天(25920计算时间步)预报结果的均方根误差低于0.001,满足海洋数值预报的时效性和精度要求。; 逄仁波张云泉谭光明徐建良贾海鹏解庆春; 关键词：非阻塞 SOR

基于存储级并行的同时多线程电压紧急容错技术: 时钟门控技术引起的电流波动以及供电网络上的寄生阻抗效应,共同形成感应噪声（dI/dt）并引起供电电压波动。供电电压波动过大可能引发时延故障并最终影响系统正确运行,这类电压波动被称为电压紧急。相比于单线程处理器,同时多线程...; 胡杏胡瑜李晓维; 关键词：同时多线程存储级并行; 文献传递

基于交互冲突的服务互操作匹配性检测被引量：9: 2013年; 随着互联网中包含多个交互的复杂服务的大量出现,如何有效检测服务之间的匹配性至关重要.与传统的业务流程互操作匹配性验证不同,在互联网环境下匹配性检测,一方面要面临如何实现快速检测的挑战,另一方面要解决如何准确地检测完整且精确的不匹配原因以便及时修正.为此,文中提出了一种基于交互冲突的服务互操作性检测方法,该方法利用局部交互之间的行为约束关系检测复杂服务互操作的匹配性,并形式化证明了该方法能够获得与经典的互操作匹配性检测方法一致的检测结果.与经典的互操作匹配性检测方法相比,该文方法时间复杂度低且检测结果可以确切地给出完整、精确的互操作不匹配的原因.; 公帅熊锦华刘志勇; 关键词：WEB服务互操作

面向最终用户的组合服务推荐被引量：1: 2013年; 为了提高服务组合的效率,提出基于混合相似度策略的组合服务推荐方法,基于用户未完成的组合服务来推荐相似度最高的若干已完成的组合服务。根据组合服务完成程度的不同,提出两种组合服务相似性度量方法:基于BCR模型的行为相似性度量和基于组合服务描述文档的词频—逆向文件频率内容相似性度量。实验表明,该方法的推荐准确率和推荐效率均比经典的组合服务相似性度量方法高,与人工标注数据的相关程度也较高;同时,行为相似性度量更适合完成程度更高的组合服务推荐,而内容相似性度量更适合初始阶段。; 公帅熊锦华刘志勇; 关键词：最终用户相似度计算

面向高可靠片上网络通信的低成本可重构路由算法: 为了满足系统对通信带宽的要求,片上网络逐渐取代总线成为当前多核及众核系统的主流互连方案.然而,由于芯片特征尺寸的不断减小,芯片内发生故障的概率显著增加.为了提供可靠的片上通信,本文提出了一种低成本的可重构路由算法.通过对...; 付斌章韩银和李华伟李晓维; 关键词：容错路由; 文献传递

Single-particle 3D reconstruction on specialized stream architecture and comparison with GPGPUs: 2014年; The wide acceptance and data deluge in medical imaging processing require faster and more efficient systems to be built.Due to the advances in heterogeneous architectures recently,there has been a resurgence in the first research aimed at FPGA-based as well as GPGPU-based accelerator design.This paper quantitatively analyzes the workload,computational intensity and memory performance of a single-particle 3D reconstruction application,called EMAN,and parallelizes it on CUDA GPGPU architectures and decouples the memory operations from the computing flow and orchestrates the thread-data mapping to reduce the overhead of off-chip memory operations.Then it exploits the trend towards FPGA-based accelerator design,which is achieved by offloading computingintensive kernels to dedicated hardware modules.Furthermore,a customized memory subsystem is also designed to facilitate the decoupling and optimization of computing dominated data access patterns.This paper evaluates the proposed accelerator design strategies by comparing it with a parallelized program on a 4-cores CPU.The CUDA version on a GTX480 shows a speedup of about 6 times.The performance of the stream architecture implemented on a Xilinx Virtex LX330 FPGA is justified by the reported speedup of 2.54 times.Meanwhile,measured in terms of power efficiency,the FPGA-based accelerator outperforms a 4-cores CPU and a GTX480 by 7.3 times and 3.4 times,respectively.; 段勃Wang WendiTan GuangmingMeng Dan; 关键词：CRYO-EM

基于功能等价类的FPGA细粒度可靠性设计方法研究: 随着FPGA集成电路制造技术的不断进步,晶体管特征尺寸已经进入到纳米级别,可靠性逐渐成为制约FPGA应用的瓶颈。由于SRAM型FPGA包含大量存储单元,芯片受软错误的影响尤为严重。已有的针对FPGA软错误的可靠性设计方法...; 黄柯衡胡瑜李晓维刘波刘鸿瑾华更新; 关键词：FPGA 软错误细粒度; 文献传递

用于多核同步优化的cache一致性协议设计: 2013年; 通过对多核同步过程中的访存行为进行分析,提出了一种识别同步类型的方法,并设计了一种实现同步优化的新的cache一致性协议。该协议增加了一个用于记录同步信息的cache状态,通过阻塞的方式可以让多个处理器核串行地完成同步操作,保证同步操作中原子指令能够顺利执行成功,从而大大减少由多核同步冲突引发的访存请求数量,将多核同步过程中的访存行为优化到了几乎最好的情况。实验结果表明,通过同步优化,这个新的cache一致性协议能够使多核同步的性能提升到接近最理想的结果。实验表明,相比传统的cache一致性协议,实验中采用的几个标准多核性能测试程序优化后的同步性能提升了1倍,而并行程序整体运行时间降低25%。; 陈李维张广飞张广飞汪文祥王焕东; 关键词：CACHE一致性协议

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

国家自然科学基金(60921002)

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

国家自然科学基金(60921002)

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈