您的位置: 专家智库 > >

刘昊

作品数:3 被引量:10H指数:1
供职机构:中国科学院软件研究所更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇专利
  • 1篇期刊文章

领域

  • 1篇自动化与计算...

主题

  • 3篇BLAS
  • 2篇代码
  • 2篇代码设计
  • 2篇代数
  • 2篇数学库
  • 2篇平台架构
  • 2篇线性代数
  • 2篇架构
  • 2篇核心代码
  • 1篇多核
  • 1篇函数优化

机构

  • 3篇中国科学院软...
  • 1篇中国科学院大...

作者

  • 3篇刘芳芳
  • 3篇杨超
  • 3篇张鹏
  • 3篇刘昊
  • 2篇赵玉文
  • 2篇孙乔
  • 1篇蒋丽娟

传媒

  • 1篇计算机系统应...

年份

  • 1篇2019
  • 2篇2016
3 条 记 录,以下是 1-3
排序方式:
一种基于申威平台的基础线性代数库BLAS三级函数GEMM的高性能实现方法
本发明提出了一种基于申威平台的基础线性代数库BLAS三级函数GEMM的高性能实现方法,针对国产申威SW1600平台,采用“interface接口?driver驱动?kernel汇编核心代码”的三层代码设计框架,使用乘加指...
刘昊杨超刘芳芳赵玉文张鹏孙乔
基于申威1600的3级BLAS GEMM函数优化被引量:10
2016年
BLAS是当前科学计算领域重要的底层支持数学库之一,其中的3级BLAS函数应用最为广泛.本文基于国产申威1600平台,提出了一种基础线性代数库BLAS的三级函数通用矩阵乘GEMM的高性能实现方法.在单核上,使用乘加指令、循环展开、软件流水线指令重排、SIMD向量化运算、寄存器分块技术等与平台架构相关的技术手段,实现汇编级手工优化;在多核上,提出了适用于该平台的多线程加速方案.实验结果显示,在单核串行性能测试中,与知名开源数学库Goto BLAS相比,我们实现了平均4.72倍的加速效果;在多核并行扩展测试中,4线程版的性能则平均达到了单线程版性能的3.02倍.
刘昊刘芳芳张鹏杨超杨超
关键词:多核
一种基于申威平台的基础线性代数库BLAS三级函数GEMM的高性能实现方法
本发明提出了一种基于申威平台的基础线性代数库BLAS三级函数GEMM的高性能实现方法,针对国产申威SW1600平台,采用“interface接口‑driver驱动‑kernel汇编核心代码”的三层代码设计框架,使用乘加指...
刘昊杨超刘芳芳赵玉文张鹏孙乔
文献传递
共1页<1>
聚类工具0