徐金秀
- 作品数:50 被引量:53H指数:5
- 供职机构:江南计算技术研究所更多>>
- 发文基金:国家重点基础研究发展计划国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术理学天文地球自然科学总论更多>>
- 气体动理论统一算法中的CPU+GPU异构并行优化方法
- 本发明公开了一种气体动理论统一算法中的CPU+GPU异构并行优化方法,包括CPU+GPU异构并行的实现以及优化;优化方法包括:S1、基于Boltzmann方程统一算法的并行运行流程和热点代码,对CPU消耗时间进行统计;S...
- 李志辉张子彬彭傲平白智勇徐金秀吴俊林蒋新宇
- 基于数据结构的众核程序重构方法
- 本发明公开一种基于数据结构的众核程序重构方法,包括基于提取基本类型数据结构的重构方法、基于数组降维的空间压缩的重构方法、基于增大传输字长的空间压缩的重构方法。本发明主要针对多级异构众核并行计算问题中多样化的数据结构,提供...
- 徐金秀何香陈鑫徐占刘鑫李芳孙唯哲郭恒赵朋朋
- 基于序列分层的异构众核快速傅里叶变换方法
- 本发明公开一种基于序列分层的异构众核快速傅里叶变换方法,包括以下步骤:S1、将待转序列按FFT运算层序进行分块,分块大小为当前运算层一次基本运算的子序列大小,即第1次分块时,每个分块的大小为2,即将输入序列分成大小为2的...
- 孙唯哲陈鑫陈德训刘鑫李芳徐金秀郭恒赵朋朋
- BCCAGCM模式在神威·太湖之光系统的优化被引量:5
- 2019年
- 开展气象数值模式在神威·太湖之光系统的移植与优化,对研究模式与新型计算架构的适应性有重要意义。该文以BCCAGCM模式为研究对象,将其移植到神威·太湖之光全国产异构众核计算系统,进行性能分析,对模式动力框架和物理过程计算结构进行调整,将计算核心段采用OpenACC技术进行众核加速优化,大量代码进行算法重构。结果表明:各核心段计算效率基本达到未优化的3倍左右,最高可达14倍左右,将各核心段集成,形成异构众核集成版本,可正确、稳定运行,计算误差合理。在不同并行规模,采用从核对模式整体计算进行加速效果比较稳定,基本保持在1.9倍,26000核并行规模动力试验并行效率约70%,其他试验约为57%。
- 魏敏王彬何香孙俊姜小成肖洒张莉徐金秀
- 关键词:异构计算
- 求解Boltzmann模型方程高性能并行算法在航天跨流域空气动力学应用研究被引量:9
- 2016年
- 对Boltzmann方程碰撞积分物理分析与可计算建模,得到适于描述航天再入从外层空间到近地面各流域统一Boltzmann模型方程,提出求解Boltzmann模型方程统一算法高性能并行计算数学模型.发展离散速度空间区域分解大规模并行计算技术,分析统一算法变量依赖关系,建立可扩展并行计算方案;研究数据并行分布与并行执行特征,开展大规模并行化程序设计,并在小、中、大规模256-512、4096-20 625CPU及异构计算机500-45 000、3125-112 500进程并行算法测试,建立稳定运行于国产千万亿次超级计算机高性能可扩展大规模并行算法与航天器再入跨流域复杂气动力/热绕流问题并行化软件应用平台.通过对稀薄流到连续流再入飞行不同高度可回收返回式卫星飞行器、近空间大尺度机动飞行器跨流域绕流环境不同粒度高性能计算与验证,揭示大尺度复杂结构飞行器跨流区飞行稀薄过渡流区热流系数比连续、近连续流区热流系数随物面变化剧烈得多、大得多,发现该类飞行器后端面热流最大值发生在水平舵外侧拐角处,达驻点热流六分之一量级,提供了一个可靠求解航天器再入各流域高超声速绕流问题统一算法高性能并行计算应用研究方向.
- 李志辉蒋新宇吴俊林徐金秀白智勇
- 关键词:航天器BOLTZMANN模型方程
- 大规模异构并行计算的容错方法
- 本发明提供了一种大规模异构并行计算的容错方法,包括:对每个时间步的每个核心计算模块,进行以下处理:将计算课题的计算数组的内容赋值给备份数组;完成核心计算模块的计算;其中,完成核心计算模块的计算包括:统计可用处理器核数,以...
- 陈德训刘鑫李芳徐金秀
- 一种基于RDMA机制的并行输入输出方法
- 本发明提供了一种基于RDMA机制的并行输入输出方法。所述并行输入输出方法包括:客户端通过套接字端口向服务器发送输入输出操作信息;客户端通过InfiniBand端口向服务器传送输入输出操作数据;服务器根据接收到的输入输出操...
- 房田文徐金秀漆锋滨周明忠陈德训
- N-S方程并行求解性能研究
- 2004年
- N-S方程在CFD(computational fluid dynamics)领域有着广泛的应用。该文介绍了数值模拟CFD中N-S方程的两种求解方法:块三对角法和标量五对角法。在分析了求解过程的数据内在关系后,提出了用单分区和多分区进行区域分裂并行求解的不同策略,着重考虑了在一个消息传递型系统上求解的最小执行时间,并对数据相关性、通信开销、存储开销等相关性能给出了较详细的分析研究,最后给出了性能测试的部分结果。
- 谭菊仙徐金秀陆鑫达
- 关键词:数据分布
- 面向众核架构的稀疏矩阵向量乘众核优化方法
- 本发明公开了种面向众核架构的稀疏矩阵向量乘众核优化方法,包括以下步骤:S1、已知:行数为m,列数为n的稀疏矩阵A,长为n的向量x;求解长度为m的向量y,y=Ax为稀疏矩阵A与向量x的点积;S1、定义x向量块大小blk_x...
- 郭恒陈鑫刘鑫陈德训李芳徐金秀孙唯哲
- MPI并行调试与优化策略在三维绕流气体运动论数值模拟中的应用被引量:2
- 2012年
- 从求解三维绕流问题的Boltzmann模型方程的数值模拟程序出发,通过研究区域分解并行计算策略,引入输入/输出、通信与CACHE等优化策略,对数值模拟程序进行MPI并行化移植与高性能计算调试。以高空稀薄过渡流区飞行器绕流状态为算例,进行了MPI大规模并行计算测试,证实了所发展的MPI并行化区域分解策略及程序优化途径的正确性。研究表明开展的并行化实现能明显地缩短模式计算时间,并取得较好的效果。
- 徐金秀李志辉尹万旺
- 关键词:BOLTZMANN模型方程并行计算