您的位置: 专家智库 > >

赵慰

作品数:4 被引量:4H指数:1
供职机构:中国科学院计算机网络信息中心更多>>
发文基金:国家重点基础研究发展计划国家重点实验室开放基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 1篇会议论文

领域

  • 3篇自动化与计算...

主题

  • 2篇第一性原理
  • 2篇预条件
  • 2篇格点
  • 2篇CUDA
  • 2篇GPU集群
  • 1篇第一性原理计...
  • 1篇迭代法
  • 1篇异构
  • 1篇异构平台
  • 1篇软件包
  • 1篇统一计算架构
  • 1篇图形处理器
  • 1篇排序
  • 1篇局域
  • 1篇计算架构
  • 1篇计算软件包
  • 1篇架构
  • 1篇共轭梯度
  • 1篇共轭梯度法
  • 1篇CG

机构

  • 4篇中国科学院
  • 3篇中国科学院大...
  • 1篇中国科学技术...

作者

  • 4篇赵慰
  • 4篇赵永华
  • 2篇赵莲
  • 2篇陈尧
  • 1篇何力新
  • 1篇刘晓辉

传媒

  • 2篇计算机科学与...
  • 1篇计算机研究与...
  • 1篇2013全国...

年份

  • 2篇2015
  • 1篇2014
  • 1篇2013
4 条 记 录,以下是 1-4
排序方式:
GPU集群加速近似逆预条件CG并行求解器被引量:1
2015年
针对GPU集群系统,研究了分解近似逆(approximate inverse,AINV)和对称逐次超松弛-近似逆(symmetric successive over relaxation approximate inverse,SSOR-AI)两类近似逆预条件的并行算法。采用多级k-路图划分方法,通过子图的内点和边界点识别方法以及稀疏矩阵的置换技术,提出了将稀疏矩阵转换为分块箭形矩阵的并行方法。基于所形成的分块箭形矩阵,结合块内稀疏矩阵近似逆串行、块间并行的策略给出了近似逆预条件的并行方法,实现了AINV和SSOR-AI并行算法,解决了AINV预条件难以并行的问题。基于CPU与GPU协同计算、主机端页锁定内存和设备端计算与通信重叠的优化技术,实现了并行近似逆预条件与共轭梯度(conjugate gradient,CG)算法相结合的线性方程组混合并行求解器。数值实验表明,所提方法对AINV和SSOR-AI两类近似逆预条件,在多GPU上获得了很好的可扩展性和加速效果。
赵莲赵永华陈尧赵慰
关键词:预条件迭代法GPU集群
基于GPU异构平台的第一性原理计算软件加速
第一性原理计算软件在密度泛函理论的发展中起着重要作用。相比平面波方法,局域轨道法更适合处理大规模多体问题。随着问题规模的不断增大和计算机计算能力的提升,软件的并行加速成为一个重要课题。在继续增加CPU 处理器数量已经无法...
赵慰赵永华刘晓辉何力新
关键词:CUDA第一性原理
GPU加速不完全Cholesky分解预条件共轭梯度法被引量:3
2015年
不完全Cholesky分解预条件共轭梯度(incomplete Cholesky factorization preconditioned conjugate gradient,ICCG)法是求解大规模稀疏对称正定线性方程组的有效方法.然而ICCG法要求在每次迭代中求解2个稀疏三角方程组,稀疏三角方程组求解固有的串行性成为了ICCG法在GPU上并行求解的瓶颈.针对稀疏三角方程组求解,给出了一种利用GPU加速的有效方法.为了增加稀疏三角方程组求解在GPU上的多线程并行性,提出了对不完全Cholesky分解产生的稀疏三角矩阵进行分层调度(level scheduling)的方法.为了进一步提高稀疏三角方程组求解的并行性能,提出了在分层调度前通过近似最小度(approximate minimum degree,AMD)算法对系数矩阵进行重排序、在分层调度后对稀疏三角矩阵进行层排序的方法,降低了分层调度过程中产生的层数,优化了稀疏三角方程组求解的GPU内存访问模式.数值实验表明,与利用NVIDIA CUSPARSE实现的ICCG法相比,采用上述方法性能可以获得平均1倍以上的提升.
陈尧赵永华赵慰赵莲
关键词:预条件共轭梯度法图形处理器
第一性原理计算软件包在GPU集群上的加速
2014年
第一性原理计算软件在密度泛函理论的发展中起着重要作用。相比平面波方法,局域轨道法更适合处理大规模多体问题。随着问题规模的不断增大和计算机计算能力的提升,软件的并行加速成为一个重要课题,MPI(message passing interface)结合GPU(graphic processing unit)实现的异构并行是一个新的解决方案。基于局域轨道法的第一性原理计算软件MESIA(massive electronic simulation based on systematically improvable atomic bases)经过MPI+OpenMP+CUDA三级并行,单GPU取得了约15倍的加速比,同时表现出了良好的可扩展性。测试结果同时验证了使用GPU计算可以保证计算精度。
赵慰赵永华刘晓辉何力新
关键词:第一性原理
共1页<1>
聚类工具0