姜金荣
- 作品数:44 被引量:65H指数:4
- 供职机构:中国科学院计算机网络信息中心更多>>
- 发文基金:国家自然科学基金中国科学院知识创新工程国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术天文地球理学文化科学更多>>
- 分块Gram-Schmidt正交化算法及其应用被引量:3
- 2009年
- Gram-Schmidt正交化算法是数值线性代数中的基本算法之一,主要用于计算矩阵QR分解.经典和修正Gram-Schmidt正交化算法基于level1/2BLAS运算,低级BLAS运算对cache的利用率比较低,从而限制了算法性能.提出一种新的分块Gram-Schmidt正交化算法.新算法通过重正交保证产生矩阵Q的正交性达到机器精度,并且利用level3BLAS运算提高了算法性能.数值试验表明,新算法能使得矩阵Q的正交性达到机器精度,并且新算法使得性能得到显著提高.
- 赵韬姜金荣
- 关键词:GRAM-SCHMIDT正交化分块算法QR分解
- 数学家和物理学家的趣闻轶事
- 2007年
- 本书的作者是美国Rutgers大学数学系的Simo Gindikin教授,出生于原苏联。Simo Gindikin教授是表示论、积分几何和多复变函数的专家。本书的译者是美国Wellesley大学数学系的Alan Shuchat教授。Alan Shuchat教授的学术兴趣广泛,特别是喜欢旅行和学习各种外语,使得他能轻松胜任本书的翻译工作。
- 姜金荣
- 关键词:物理学家SIMOALAN多复变函数积分几何
- 一种改进的遗传算法及在结构工程中的应用
- 在该文中,第一章简单介绍了传统遗传算法的基本知识;第二章在分析了现有遗传算法的一些缺点的基础上,提出了对遗传算法的改进;最后对结构优化中的一些算例进行计算和分析,发现该算法比一般的遗传算法具有更好的改敛速度和收敛精度,并...
- 姜金荣
- 关键词:遗传算法METROPOLIS准则适应度函数遗传算子自适应基因库
- 文献传递
- 基于Windows Azure云并行计算的期权定价SaaS
- 2019年
- 计算速度对于期权交易者至关重要,关系到如何有效地制定价格并评估相应的风险,而云并行计算提供的随收随付制(pay-as-you-go)可以实现低成本运行。在微软云平台Windows Azure的基础上,开发了基于云并行计算的期权定价试点云软件AzureOP,该软件以较低的费用提供了低风险和高速度,并给出了AzureOP对于美式期权价格的模拟结果,绘制了对应的期权价格定价曲线和定价曲面。最后,对云并行计算在金融应用上的优势和不足进行了总结和讨论,同时举例说明了试点云软件AzureOP的具体细节。
- 林溢星赵地迟学斌姜金荣
- 关键词:并行计算计算金融期权定价
- 高性能计算数值模拟框架软件研究进展被引量:2
- 2021年
- 【背景】本世纪我国超级计算机得到迅速发展,为降低面向超级计算机并行编程难度,高性能编程框架已经成为高性能计算的研究方向之一。【方法】本文简要介绍了高性能数值模拟编程框架的研究目的,主要关注国内外结构网格和非结构网格编程框架的发展现状。【结论】面向E级计算机即将到来,框架软件的发展也需针对E级计算机的体系结构特征,调整底层数据结构和核心算法,提升并行可扩展性,增强对异构众核计算的支持,使其能具备支撑开发E级并行计算应用软件的能力。同时也需要结合领域专家的需求,不断拓展新领域新方向,针对新问题开发新的功能模块,以便应用到更多的科学计算领域。
- 何连花赵莲姜金荣金钟
- 关键词:编程框架数值模拟
- 海洋环流模式LICOM的GPU实现与优化被引量:3
- 2020年
- 【目的】为了加速海洋环流模式LICOM的积分计算,降低因分辨率的提升而带来的运行成本,本文设计并实现了基于CUDA C的GPU加速版本。【方法】本文基于目前最新的LICOM3版本,在分析LICOM海洋网格块的并行算法的基础上,结合使用CUDA线程并行计算海洋网格点,将LICOM主要计算程序移植到GPU平台上,并从数据传输和设备内存的使用两个方面进行优化。【结果】实验表明,GPU版本模拟结果的与原CPU版本基本一致。与使用相同数量的Intel Xeon E5-2680 V2 CPU相比,使用2至16块NVIDIA K20 GPU单个模式天加速了9.31到1.27倍。【局限】由于LICOM3计算的边界同步通信比较多,限制了程序的可扩展性,未来需要通过边界通信优化和算法优化来提高模式的可扩展性。【结论】本文对LICOM3程序进行了GPU版本的实现和优化,取得了一定的加速效果并保持较好的扩展性,为今后面向更大规模计算的海洋环流模式发展提供了经验和参考。
- 张留莹王鹏飞张峰刘海龙林鹏飞王涛韦俊林田少博姜金荣迟学斌
- 关键词:GPUCUDA并行计算海洋环流模式
- 一种Fortran到CUDA C的转换方法
- 2022年
- 基于GPU的异构计算逐渐成为主流计算方法,但限于科学计算编程的历史发展,大量的数值计算软件仍以Fortran语言实现.为了提高计算速度,大量的软件需要移植为CUDA C,但人工实现程序移植是一项浩繁的工程.若能实现从Fortran到CUDA C的自动转换,可以极大的提高程序开发效率.本文设计了将Fortran转换为CUDA C的算法,并基于正则表达式和shell脚本实现了该算法,编写测试用例进行了验证.实验表明,该算法可靠稳定兼容性好,在大型程序的移植过程中,能够自动筛选并建立变量信息表,生成CUDA相关操作函数,且结果代码可读性较好,转化正确率达80%以上,有效减少了移植的工作量.
- 刘颖辉迟学斌姜金荣姜金荣
- 关键词:FORTRAN并行计算正则表达式
- 高级最优化工具箱TAO评介
- 2005年
- 本文通过在曙光2000Ⅱ的运行,从起源与现状、设计原理、核心组件、具体算例等方面给出了高级最优化工具箱TAO的一个评介,并从具体实用中给出了TAO的优缺点及建议.
- 王建迟学斌姜金荣谷同祥温红子刘文博
- 关键词:TAO优化工具箱设计原理核心组件
- 海洋模式LICOM的MIC并行优化被引量:4
- 2015年
- LICOM是中国科学院大气物理研究所开发的全球海洋环流模式,广泛应用于海洋研究和气候预测。随着分辨率的提高,LICOM对计算的要求呈几何级数的增长。多核或众核已成为当前主流的高性能计算体系结构,原LICOM程序只使用了MPI并行,无法发挥混合架构的高性能。本文介绍了如何在分析LICOM特征基础之上,应用Open MP及其它优化手段对LICOM进行MIC移植和并行优化,详细介绍了模式优化的实现过程。并通过数值试验证明了优化前后的计算效果有一定提高。
- 王文浩姜金荣王玉柱迟学斌
- 关键词:并行计算海洋环流OPENMP
- MM5在深腾6800上的移植及其数值计算方法研究被引量:2
- 2006年
- MM5是当今世界各国中短期天气及气候预测、实时预报和环境检测中使用十分广泛的数值模式,因此,如何提高软件的计算精度和计算效率是一个十分重要的问题.本文简要介绍了MM5的数值计算方法,为以后的研究提供帮助,并把MM5软件移植到深腾6800上进行并行计算.发现每当处理器增加一倍,其加速比为原来的1.5倍,可见其并行效率是较好的,值得在气象科研和业务中广泛使用.
- 姜金荣迟学斌陆忠华刘洪利
- 关键词:MM5中尺度加速比