您的位置: 专家智库 > >

徐金秀

作品数:50 被引量:53H指数:5
供职机构:江南计算技术研究所更多>>
发文基金:国家重点基础研究发展计划国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术理学天文地球自然科学总论更多>>

文献类型

  • 26篇专利
  • 17篇期刊文章
  • 5篇会议论文

领域

  • 21篇自动化与计算...
  • 2篇天文地球
  • 2篇理学
  • 1篇电子电信
  • 1篇交通运输工程
  • 1篇航空宇航科学...
  • 1篇自然科学总论

主题

  • 15篇异构
  • 15篇并行计算
  • 6篇数据分布
  • 5篇架构
  • 4篇数据结构
  • 4篇数值模拟
  • 4篇数组
  • 4篇气候
  • 4篇海洋模式
  • 3篇循环量
  • 3篇应用软件
  • 3篇语句
  • 3篇容错
  • 3篇神威
  • 3篇输入输出
  • 3篇数据相关
  • 3篇数据相关性
  • 3篇太湖
  • 3篇气候模式
  • 3篇网络

机构

  • 46篇江南计算技术...
  • 6篇中国空气动力...
  • 3篇北京航空航天...
  • 3篇清华大学
  • 3篇上海交通大学
  • 3篇中国船舶科学...
  • 2篇中国气象局国...
  • 2篇国家气象信息...
  • 1篇哈尔滨工程大...
  • 1篇中国科学院力...
  • 1篇中国气象局国...
  • 1篇国家超级计算...

作者

  • 48篇徐金秀
  • 21篇李芳
  • 20篇刘鑫
  • 18篇陈德训
  • 10篇徐占
  • 7篇李志辉
  • 4篇张天刚
  • 4篇周明忠
  • 4篇漆锋滨
  • 4篇范昊
  • 3篇房田文
  • 3篇吴俊林
  • 3篇蒋新宇
  • 3篇魏敏
  • 2篇彭傲平
  • 2篇白智勇
  • 2篇孙俊
  • 2篇尹万旺
  • 1篇王在志
  • 1篇郑岩

传媒

  • 3篇计算机科学
  • 2篇船舶力学
  • 1篇计算机学报
  • 1篇华中科技大学...
  • 1篇计算机工程与...
  • 1篇计算机工程
  • 1篇微电子学与计...
  • 1篇计算机应用研...
  • 1篇计算机工程与...
  • 1篇应用气象学报
  • 1篇计算机工程与...
  • 1篇航空动力学报
  • 1篇计算机技术与...
  • 1篇计算机科学与...
  • 1篇2005高性...
  • 1篇第七届全国并...
  • 1篇国际并行算法...

年份

  • 3篇2023
  • 6篇2022
  • 9篇2021
  • 3篇2020
  • 6篇2019
  • 2篇2018
  • 3篇2016
  • 3篇2015
  • 1篇2014
  • 1篇2013
  • 1篇2012
  • 2篇2011
  • 1篇2009
  • 2篇2006
  • 1篇2005
  • 2篇2004
  • 2篇2003
50 条 记 录,以下是 1-10
排序方式:
气体动理论统一算法中的CPU+GPU异构并行优化方法
本发明公开了一种气体动理论统一算法中的CPU+GPU异构并行优化方法,包括CPU+GPU异构并行的实现以及优化;优化方法包括:S1、基于Boltzmann方程统一算法的并行运行流程和热点代码,对CPU消耗时间进行统计;S...
李志辉张子彬彭傲平白智勇徐金秀吴俊林蒋新宇
基于数据结构的众核程序重构方法
本发明公开一种基于数据结构的众核程序重构方法,包括基于提取基本类型数据结构的重构方法、基于数组降维的空间压缩的重构方法、基于增大传输字长的空间压缩的重构方法。本发明主要针对多级异构众核并行计算问题中多样化的数据结构,提供...
徐金秀何香陈鑫徐占刘鑫李芳孙唯哲郭恒赵朋朋
基于序列分层的异构众核快速傅里叶变换方法
本发明公开一种基于序列分层的异构众核快速傅里叶变换方法,包括以下步骤:S1、将待转序列按FFT运算层序进行分块,分块大小为当前运算层一次基本运算的子序列大小,即第1次分块时,每个分块的大小为2,即将输入序列分成大小为2的...
孙唯哲陈鑫陈德训刘鑫李芳徐金秀郭恒赵朋朋
BCCAGCM模式在神威·太湖之光系统的优化被引量:5
2019年
开展气象数值模式在神威·太湖之光系统的移植与优化,对研究模式与新型计算架构的适应性有重要意义。该文以BCCAGCM模式为研究对象,将其移植到神威·太湖之光全国产异构众核计算系统,进行性能分析,对模式动力框架和物理过程计算结构进行调整,将计算核心段采用OpenACC技术进行众核加速优化,大量代码进行算法重构。结果表明:各核心段计算效率基本达到未优化的3倍左右,最高可达14倍左右,将各核心段集成,形成异构众核集成版本,可正确、稳定运行,计算误差合理。在不同并行规模,采用从核对模式整体计算进行加速效果比较稳定,基本保持在1.9倍,26000核并行规模动力试验并行效率约70%,其他试验约为57%。
魏敏王彬何香孙俊姜小成肖洒张莉徐金秀
关键词:异构计算
求解Boltzmann模型方程高性能并行算法在航天跨流域空气动力学应用研究被引量:9
2016年
对Boltzmann方程碰撞积分物理分析与可计算建模,得到适于描述航天再入从外层空间到近地面各流域统一Boltzmann模型方程,提出求解Boltzmann模型方程统一算法高性能并行计算数学模型.发展离散速度空间区域分解大规模并行计算技术,分析统一算法变量依赖关系,建立可扩展并行计算方案;研究数据并行分布与并行执行特征,开展大规模并行化程序设计,并在小、中、大规模256-512、4096-20 625CPU及异构计算机500-45 000、3125-112 500进程并行算法测试,建立稳定运行于国产千万亿次超级计算机高性能可扩展大规模并行算法与航天器再入跨流域复杂气动力/热绕流问题并行化软件应用平台.通过对稀薄流到连续流再入飞行不同高度可回收返回式卫星飞行器、近空间大尺度机动飞行器跨流域绕流环境不同粒度高性能计算与验证,揭示大尺度复杂结构飞行器跨流区飞行稀薄过渡流区热流系数比连续、近连续流区热流系数随物面变化剧烈得多、大得多,发现该类飞行器后端面热流最大值发生在水平舵外侧拐角处,达驻点热流六分之一量级,提供了一个可靠求解航天器再入各流域高超声速绕流问题统一算法高性能并行计算应用研究方向.
李志辉蒋新宇吴俊林徐金秀白智勇
关键词:航天器BOLTZMANN模型方程
大规模异构并行计算的容错方法
本发明提供了一种大规模异构并行计算的容错方法,包括:对每个时间步的每个核心计算模块,进行以下处理:将计算课题的计算数组的内容赋值给备份数组;完成核心计算模块的计算;其中,完成核心计算模块的计算包括:统计可用处理器核数,以...
陈德训刘鑫李芳徐金秀
一种基于RDMA机制的并行输入输出方法
本发明提供了一种基于RDMA机制的并行输入输出方法。所述并行输入输出方法包括:客户端通过套接字端口向服务器发送输入输出操作信息;客户端通过InfiniBand端口向服务器传送输入输出操作数据;服务器根据接收到的输入输出操...
房田文徐金秀漆锋滨周明忠陈德训
N-S方程并行求解性能研究
2004年
N-S方程在CFD(computational fluid dynamics)领域有着广泛的应用。该文介绍了数值模拟CFD中N-S方程的两种求解方法:块三对角法和标量五对角法。在分析了求解过程的数据内在关系后,提出了用单分区和多分区进行区域分裂并行求解的不同策略,着重考虑了在一个消息传递型系统上求解的最小执行时间,并对数据相关性、通信开销、存储开销等相关性能给出了较详细的分析研究,最后给出了性能测试的部分结果。
谭菊仙徐金秀陆鑫达
关键词:数据分布
面向众核架构的稀疏矩阵向量乘众核优化方法
本发明公开了种面向众核架构的稀疏矩阵向量乘众核优化方法,包括以下步骤:S1、已知:行数为m,列数为n的稀疏矩阵A,长为n的向量x;求解长度为m的向量y,y=Ax为稀疏矩阵A与向量x的点积;S1、定义x向量块大小blk_x...
郭恒陈鑫刘鑫陈德训李芳徐金秀孙唯哲
MPI并行调试与优化策略在三维绕流气体运动论数值模拟中的应用被引量:2
2012年
从求解三维绕流问题的Boltzmann模型方程的数值模拟程序出发,通过研究区域分解并行计算策略,引入输入/输出、通信与CACHE等优化策略,对数值模拟程序进行MPI并行化移植与高性能计算调试。以高空稀薄过渡流区飞行器绕流状态为算例,进行了MPI大规模并行计算测试,证实了所发展的MPI并行化区域分解策略及程序优化途径的正确性。研究表明开展的并行化实现能明显地缩短模式计算时间,并取得较好的效果。
徐金秀李志辉尹万旺
关键词:BOLTZMANN模型方程并行计算
共5页<12345>
聚类工具0