杨灿群
- 作品数:138 被引量:112H指数:6
- 供职机构:国防科学技术大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家科技重大专项更多>>
- 相关领域:自动化与计算机技术文化科学电子电信理学更多>>
- 面向双精度SIMD部件的矩阵乘实现方法
- 本发明公开了一种面向双精度SIMD部件的矩阵乘实现方法,目的是提高矩阵乘在SIMD部件上的计算速度。技术方案是先增加矩阵B和矩阵C的列数;然后对矩阵A、B进行分块;A的每个分块和对应的B分块使用SIMD部件进行相乘,并将...
- 杜云飞李春江杨灿群黄春赵克佳易会战陈娟彭林左克
- 文献传递
- 基于动态数据划分和冲突消解的高通量药物虚拟筛选方法
- 本发明公开了基于动态数据划分和冲突消解的高通量药物虚拟筛选方法,目的是提高药物虚拟筛选的速度和效率,缩短新药研究周期。技术方案是进程分组,任务分为两大部分,第一部分采用静态任务划分,由各组长进程以轮转方式获取筛选作业,分...
- 彭绍亮程乾杨灿群卢宇彤刘杰吴诚堃顾祥高明刘欣王海强杨顺云
- 文献传递
- 一种基于粒子网格适配算法的流固耦合方法以及装置
- 本申请涉及一种基于粒子网格适配算法的流固耦合方法以及装置。所述方法包括:根据流固耦合实验要求进行初始化,生成临界网格,确定接触粒子;以临界网格作为中间媒介实现流体端和耦合框架preCICE之间的连接,将流体端产生的力和临...
- 杨灿群龙思凡葛振郭晓威范小康李超唐滔崔英博
- 异构并行计算结点的峰值功耗控制方法
- 本发明公开了一种异构并行计算结点的峰值功耗控制方法,目的是动态控制异构并行结点的峰值功耗,尽可能地减少功耗控制对结点执行性能的影响。技术方案是先构建由结点功耗描述文件、结点功耗预算设置子系统、协处理器负载监控子系统、处理...
- 杨灿群刘勇鹏卢凯肖立权杜云飞迟万庆王锋李宽邢建英高颖慧
- 文献传递
- GCC后端中四路双精度短向量寄存器的实现被引量:1
- 2012年
- 设计和实现一个新的产品化的编译器通常需要几年时间。基于已有的编译器进行修改和扩展,是研发面向新体系结构的编译器的主要途径。GNU编译器集合(GCC)支持多种高级语言和多种目标处理器平台、文档及源代码开放等。基于GCC的Sparc后端,实现了支持四路双精度SIMD指令的四路双精度短向量寄存器的描述。在此过程中,定义了新的目标机,扩充了一类向量模式,定义了一类新的寄存器约束,实现了四路双精度寄存器的描述,定义了四路双精度SIMD指令的机器描述。对于面向此类SIMD指令的内嵌函数,GCC编译器能够正确使用该类向量寄存器来生成对应的SIMD指令。
- 李春江杜云飞倪晓强王永文杨灿群
- 用于共享存储多核多线程处理器硬件锁的验证方法
- 本发明公开了一种用于共享存储多核多线程处理器硬件锁的验证方法,实施步骤如下:1)初始化设置同步线程数目、线程访问存储器的最大访问次数;2)构造用于操作共享存储多核多线程处理器硬件锁的同步操作模块;3)根据所述同步线程数目...
- 廖湘科李春江杜云飞晏小波隋兵才邓让钰王永文杨灿群窦强徐炜遐卢凯
- 文献传递
- 面向众核处理器的片上锁变量全局编址存储方法及装置
- 本发明公开了一种面向众核处理器的片上锁变量全局编址存储方法及装置,方法步骤如下:1)预先建立全局编址片上锁存储器;构造应用程序时对锁变量进行标注,在编译和链接时将锁变量分配到独占的地址空间;2)加载应用程序时,将锁变量所...
- 李春江王永文杨灿群冯华高军唐滔
- 文献传递
- 面向存储层次设计优化的GPU程序性能分析被引量:2
- 2017年
- 图形处理器凭借着比传统CPU更高的峰值性能和能效,以及日渐成熟的软件环境,逐渐成为构建异构并行系统的最流行的加速器之一。虽然GPU依靠轻量级线程的灵活切换来隐藏访存延迟,但其超高的并发度仍然给存储系统带来了很大压力,其性能的有效发挥受访存效率的强烈影响。因此GPU程序的访存行为分析及优化一直是GPU相关领域的研究热点,但很少有工作从体系结构的角度分析存储层次的设计对性能的影响。为了更好地指导GPU存储层次的设计和访存优化,从实验的角度详细地分析了GPU各存储层次对程序性能的影响,并总结出若干指导性的优化策略,为未来类似体系结构的存储层次设计和程序优化提供建议。
- 唐滔彭林黄春杨灿群
- 关键词:异构系统图形处理器性能分析
- 基于指针网络的解码器的生物医药知识抽取方法和装置
- 本申请涉及大数据处理技术领域的一种基于指针网络的解码器的生物医药知识抽取方法和装置。所述方法包括:设置相互作用元组表示形式;获取生物医药文献的摘要文本数据,并将摘要文本数据中的单词和字符映射成嵌入向量,得到源文本序列的特...
- 邱炎龙杨灿群吴诚堃刘毅赵然张森
- 一种基于负载平衡的CPU和GPU两级动态任务划分方法
- 本发明公开了一种基于负载平衡的CPU和GPU两级动态任务划分方法,要解决的技术问题在于:实现CPU和GPU之间、CPU多核之间的任务负载平衡。技术方案是为CPU和GPU之间以及CPU多核之间的任务划分建立两个数据库,记录...
- 廖湘科王锋杨灿群陈娟杜云飞易会战黄春赵克佳
- 文献传递