姚文军
- 作品数:8 被引量:15H指数:2
- 供职机构:中国科学技术大学更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 神威·太湖之光上分子动力学软件的实现与优化
- 神威·太湖之光是我国自主研制的新一代超级计算机系统,全系统峰值性能为每秒12.54亿亿次,持续运算速度为每秒9.3亿亿次,均位居当今世界第一。该系统采用了40960颗申威26010众核处理器,共计1040万个处理器核心。...
- 姚文军
- 关键词:计算机系统分子动力学
- 文献传递
- 利用分组算法实现高效的并行程序模型检测
- 2016年
- 在并行时代,模型检测技术(通常也被称为状态空间搜索)是验证并行程序正确性的有效方法.由于线程执行次序的不确定性,线程之间交互次序的改变导致程序状态呈指数性增长,因此在利用状态空间搜索法搜索程序状态时,状态爆炸是亟需解决的难题.为了改善该问题,提出基于分组的模型检测方法.针对操作不同变量的线程,在程序中简单添加制导语句对其进行分组,之后利用该分组信息搜索状态空间,并实时记录已完成搜索的分组信息,从而避免搜索冗余状态.实验结果表明,本文提出的方案对于缓解状态爆炸问题有很好的效果,制导分组前后,测试程序的状态集平均减少了67%,有效提高了并行程序验证效率.
- 王云云韩文廷周军蕊陈俊仕姚文军安虹
- 一种数据组装方法、装置、设备和可读存储介质
- 本发明提供了一种数据组装方法、装置、设备和可读存储介质,可以获取待输入至模型的所有图片的尺寸集合,其中尺寸集合包括每个图片的尺寸值组。基于每个图片的尺寸值组以及预设拼接规则对所有图片进行拼接,得到一张包含所有图片的拼接图...
- 姚文军陈旭凌震华
- 定长输入神经网络模型的修改方法、装置及设备
- 本发明涉及一种定长输入神经网络模型的修改方法、装置及设备,该方法包括:获取仅支持定长输入的神经网络模型的原图后,获取神经网络模型的各算子的包括mask变换子图和mask清零子图的mask处理子图;然后,生成包含该各算子的...
- 姚文军蒋竞凌震华
- 一种计算节点的空间分配方法及装置
- 本发明实施例公开了一种计算节点的空间分配方法及装置,对神经网络的各个计算节点进行分类,得到多个的计算形状节点和多个的计算张量节点;将与每个计算张量节点相关的计算形状节点融合成一个新节点;将待推理数据输入神经网络;根据计算...
- 姚文军张海俊汪锦想陈旭凌震华
- 基于Intel Xeon Phi的稀疏矩阵向量乘性能优化被引量:1
- 2016年
- 稀疏矩阵向量乘(Sp MV)是线性求解系统等科学计算中重要的计算核心.鉴于传统的稀疏矩阵向量乘算法在Intel Xeon Phi众核集成架构上存在SIM D利用率低,不规则访存开销高及负载不均衡的问题,难以发挥其运算能力.本文针对Intel Xeon Phi的体系结构特点,提出了一种通用的分块压缩存储表示的稀疏矩阵向量乘并行算法:(1)在ELLPACK存储格式基础上按列分块及压缩矩阵,增加非零元的密度,提高SIMD利用率;(2)通过精心的数据重排,保留矩阵非零元本身的局部性,从而提高数据重用率,降低访存开销;(3)将矩阵压缩后划分成近似等大的矩阵块并静态等量分配到不同核上计算,使各核负载均衡.实验结果表明,与Intel Xeon Phi上已有的MKL数学库中的CSR算法相比,本算法获得了更高的计算访存比,性能比M KL的CSR算法平均快2.05倍.
- 张爱民安虹姚文军梁伟浩江霞李丰
- 关键词:稀疏矩阵向量乘INTELXEONPHI
- 基于神威太湖之光的NAMD软件的移植与优化被引量:12
- 2017年
- 纳米级粒度分子动力学NAMD是基于Charm++并行编程模型的开源免费分子动力学模拟软件,能够在大规模并行计算机上快速模拟百万原子级别的大分子体系。太湖之光是中国自主研发的超级计算机,峰值性能为125.4Pflop/s,共有1 000多万个核心,整机Linpack效率不低于70%。NAMD在空间上对原子进行划分,在计算上对力进行划分,充分曝露出单步模拟的并行度,并通过CHARM++对负载平衡进行调控。针对NAMD进行模拟计算时的特点,移植并优化了NAMD的核心计算代码,让其能够更好地运行在超级计算机神威太湖之光上,优化后性能提高了近20倍,单个核组的性能较Intel XeonE5-2650v2提高3倍。扩展性方面目前至多可达到325万核的并行度,突破百万核大关。
- 姚文军陈俊仕苏志超余洋廖陈志安虹
- 关键词:分子动力学模拟异构多核处理器
- 一种模型计算方法、装置及设备
- 本申请公开了一种模型计算方法、装置及设备,能够应用于神经网络模型的加速计算,将神经网络模型的计算图进行节点拆分,获取单一节点;识别单一节点并确认可融合节点;将多个可融合节点融合生成融合节点;将融合节点替代多个可融合节点,...
- 张海俊姚文军汪锦想魏岩凌震华