您的位置: 专家智库 > >

尹万旺

作品数:41 被引量:5H指数:2
供职机构:江南计算技术研究所更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术航空宇航科学技术理学电子电信更多>>

文献类型

  • 31篇专利
  • 6篇期刊文章
  • 2篇会议论文

领域

  • 10篇自动化与计算...
  • 1篇电子电信
  • 1篇航空宇航科学...
  • 1篇理学

主题

  • 10篇异构
  • 9篇通信
  • 7篇处理器
  • 6篇网络
  • 5篇内存
  • 5篇集合通信
  • 4篇带宽
  • 4篇线程
  • 4篇描述符
  • 4篇卷积
  • 3篇多线程
  • 3篇数据重用
  • 3篇数组
  • 3篇通信优化
  • 3篇主存
  • 3篇共享
  • 3篇感知
  • 3篇MPI
  • 3篇超节点
  • 2篇带宽利用率

机构

  • 39篇江南计算技术...
  • 1篇北京航空航天...
  • 1篇清华大学
  • 1篇中国空气动力...

作者

  • 39篇尹万旺
  • 29篇魏迪
  • 23篇林蓉芬
  • 13篇王丹云
  • 10篇王飞
  • 8篇杨金才
  • 6篇郑岩
  • 5篇何王全
  • 4篇周明忠
  • 4篇刘勇
  • 3篇李芳
  • 3篇刘鑫
  • 3篇陆林生
  • 2篇陈德训
  • 2篇徐金秀
  • 2篇王涛
  • 1篇漆锋滨
  • 1篇张娟
  • 1篇卿鹏
  • 1篇方燕飞

传媒

  • 2篇计算机科学
  • 1篇计算机应用与...
  • 1篇空气动力学学...
  • 1篇计算机工程与...
  • 1篇科研信息化技...
  • 1篇2006年全...

年份

  • 1篇2025
  • 1篇2024
  • 2篇2023
  • 15篇2022
  • 4篇2021
  • 1篇2020
  • 1篇2019
  • 3篇2018
  • 3篇2016
  • 1篇2014
  • 1篇2013
  • 3篇2012
  • 1篇2011
  • 2篇2006
41 条 记 录,以下是 1-10
排序方式:
一种胖树网络结构上的通信优化方法
本发明公开一种胖树网络结构上的通信优化方法,包括以下步骤:S1、假设每个超节点包含的节点数量为N,根据裁剪胖树裁剪比例1/X,计算每个超节点同时通信的最大进程数M=N*(1/X),M为同时通信时,理论上能用满带宽的超节点...
王飞林蓉芬尹万旺郑岩袁欣辉魏迪孙浩男孙强史俊达
一种异构众核架构上基于膨胀取数的卷积运算方法
本发明公开一种异构众核架构上基于膨胀取数的卷积运算方法,包括以下步骤:S1、输入input、权重weight、跨步stride,其中input为Hi*Wi,weight为K*K,根据input和weight的形状计算输出...
袁欣辉尹万旺林蓉芬魏迪郑岩王飞孙浩男孙强史俊达王丹云
基于异构众核处理器的卷积计算数据重用方法
本发明公开一种基于异构众核处理器的卷积计算数据重用方法,CPU通过数据块A和数据块B完成数据块C的卷积计算,包括以下步骤:S1、根据异构众核处理器的内核数,二维映射成N*N个,将数据块A、数据块B、数据块C划分为N*N块...
林蓉芬袁欣辉尹万旺魏迪杨金才王丹云董恩铭
基于异构众核处理器的多级访存方法、离散访存方法
本发明公开了一种基于异构众核处理器的多级访存方法及离散访存方法。所述多级访存方法包括:从核读入第一次计算所需的数据;除第一次之外,从核在进行本次数据计算的同时,读入下一次计算所需的数据;除最后一次之外,从核在进行本次数据...
陈德训尹万旺周明忠孙唯哲
一种基于扁平化模型的通信实现方法
本发明提供了一种基于扁平化模型的通信实现方法,可用于点对点通信和集合通信。所述方法包括:运算核心将用户消息的描述符在内存中进行组装;所述运算核心通过写内存方式,将描述符地址信息作为消息请求通知给控制核心;所述控制核心通过...
魏迪何王全尹万旺刘勇王涛
高可靠性集群中MPI的设计与实现
高可靠性集群软件系统主要由三部分组成:事件日志系统、检查点系统和MPI环境.本文介绍了一种为高可靠性集群设计的MPI实现SW-MPIFT,阐述了其基于悲观消息日志与非一致性检查点相结合的容错协议.并通过与其他MPI实现的...
尹万旺周明忠
关键词:检查点系统
MPI并行调试与优化策略在三维绕流气体运动论数值模拟中的应用被引量:2
2012年
从求解三维绕流问题的Boltzmann模型方程的数值模拟程序出发,通过研究区域分解并行计算策略,引入输入/输出、通信与CACHE等优化策略,对数值模拟程序进行MPI并行化移植与高性能计算调试。以高空稀薄过渡流区飞行器绕流状态为算例,进行了MPI大规模并行计算测试,证实了所发展的MPI并行化区域分解策略及程序优化途径的正确性。研究表明开展的并行化实现能明显地缩短模式计算时间,并取得较好的效果。
徐金秀李志辉尹万旺
关键词:BOLTZMANN模型方程并行计算
一种胖树网络结构上的通信优化方法
本发明公开一种胖树网络结构上的通信优化方法,包括以下步骤:S1、假设每个超节点包含的节点数量为N,根据裁剪胖树裁剪比例1/X,计算每个超节点同时通信的最大进程数M=N*(1/X),M为同时通信时,理论上能用满带宽的超节点...
王飞林蓉芬尹万旺郑岩袁欣辉魏迪孙浩男孙强史俊达
基于序列号机制的消息保序方法
本发明公开一种基于序列号机制的消息保序方法,包括以下步骤:S1、每进行一次异步消息发送操作时,发送端将当前的发送序列号打包入包头,并将发送序列号加1;S2、接收端每成功接收一次异步消息,将当前的接收序列号和包头中携带的发...
袁欣辉林蓉芬尹万旺魏迪杨金才王丹云 宋超博
一种异构众核上基于主-从模型的轻量级多线程处理方法
本发明公开一种异构众核上基于主‑从模型的轻量级多线程处理方法,设置四种线程状态,分别为初始化、等待任务、任务完成和线程退出;在共享内存上开辟长整形数组;在共享内存上开辟数组,用于线程组内主线程向从属线程传递参数;根据主线...
袁欣辉尹万旺魏迪林蓉芬孙浩男孙强史俊达
共4页<1234>
聚类工具0