孟晨
- 作品数:4 被引量:3H指数:1
- 供职机构:中国科学院更多>>
- 发文基金:国家高技术研究发展计划中国科学院信息化专项项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术天文地球更多>>
- 基于Charm++运行时环境的异构计算应用容错研究被引量:3
- 2016年
- 容错问题是大规模并行程序长时间运行中不可回避的问题,超级计算机中异构计算部件的加入使得该问题更加复杂。考察由CPU和GPU组成的异构并行系统中应用程序的容错,利用Charm++并行编程模型和CUDA的并行计算架构,对大规模计算宇宙学软件WIGEON进行重构。针对异构并行系统中存在的fail-stop硬件故障,设计并实现了内存检查点的应用容错机制。支持计算恢复后对产生变化的CPU/GPU资源配置进行自适应负载调整。通过在高性能计算机Mole8.5上的实验和分析,验证了异构容错方案的高效性和可行性,故障恢复时间仅需1-4 s。此外,使用分布式冗余数据改进了Charm++现有内存检查点存储模式,对比原有Double-in-Memory机制,性能未受影响,且最多降低了50%的额外内存使用量。
- 孟晨曹宗雁王龙迟学斌
- 关键词:容错异构负载均衡
- 大规模宇宙学数值模拟的优化和应用
- 宇宙学数值模拟是探索宇宙结构、预测暗物质分布不可或缺的基本研究手段,为指导未来巡天观测架起了从理论到精确观测之间的桥梁.我国下一代巡天项目已达国际领先地位,其巡天范围广、观测数据巨大、测量精确等特点,对数值模拟提出了更极...
- 孟晨
- 关键词:宇宙学暗物质数值模拟数据分析
- Physis语言框架在WENO高阶数值格式异构计算中的应用
- 2015年
- WENO(weighted essentially non-oscillatory)是计算流体力学中广泛采用的一种高阶数值格式。由于算法本身和异构计算编程的复杂性,需要开展异构计算代码自动生成的研究,以加速更多的应用。本文基于Physis这一领域编程语言框架,针对三维五阶WENO计算的天文应用,实现了其异构代码的自动生成。在超级计算机"元"上的测试结果表明,自动生成的异构计算代码具有良好的可扩展性,计算性能达到手工优化异构代码的72%,可为相关流体计算的异构代码生成提供借鉴。
- 邬萍孟晨王龙
- 关键词:WENO格式流体计算异构计算
- 基于Charm++并行平台的宇宙学流体模拟异构计算应用容错研究
- 目前容错问题已成为大规模并行程序长时间运行中不可回避的问题。本文针对由CPU和GPU组成的异构并行系统中的硬件故障问题,面向大规模的计算宇宙学应用,利用Charm++并行平台提出并实现了一种有效的应用容错机制。并通过实验...
- 孟晨曹宗雁王龙迟学斌
- 关键词:容错异构