刘松
- 作品数:41 被引量:13H指数:2
- 供职机构:西安交通大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划陕西省社会发展科技攻关项目更多>>
- 相关领域:自动化与计算机技术航空宇航科学技术理学一般工业技术更多>>
- 面向局部性和并行优化的循环分块技术被引量:10
- 2015年
- 循环分块是一种广泛用于改善数据局部性和开发并行性的程序变换优化技术.主要分为2类:固定分块技术和参数化分块技术,系统地总结了这2类技术,并分析了其优缺点.由于分块大小的选择会严重影响分块代码的性能,因此介绍分析了选择最优分块大小的各种方法.此外,总结了循环分块在多级分块、并行性开发和不完美嵌套循环等方面应用的各项技术.通过对循环分块技术当前研究现状的分析,得出如下结论:1)循环分块技术中的计算复杂度和生成代码效率问题还未得到完全解决,如何利用循环边界有效地约束迭代空间并提高数据局部性还需要更深入的研究;2)最优分块大小的选择依然是一个开放式难题,研究清楚分级存储架构中每级分块对性能的影响具有重要的意义;3)从循环分块的应用角度,如何有效地构建面向任意嵌套循环集的自动分块代码生成系统,同时充分利用深度共享存储资源和多核架构实现分块代码的高并行度,也是一个需要深入研究的问题.
- 刘松伍卫国赵博蒋庆
- 关键词:并行性
- 一种5G移动边缘计算环境中多智能体协同计算卸载方法
- 本发明公开了一种5G移动边缘计算环境中多智能体协同计算卸载方法,通过初始化MEC环境中设备、5G网络和光纤网络的参数,基于初始化参数采集移动设备任务队列信息、需要计算的任务信息、设备与基站的网络信息;根据采集的信息计算,...
- 伍卫国杨诗园柴玉香王雄张祥俊刘松
- 多级共享高速缓冲存储器架构下的任务分配方法和系统
- 本发明提供了一种多级共享高速缓冲存储器架构下的任务分配方法和系统,属于多核/众核处理器任务分配领域。本发明引入footprint值与地址序列长度值的比值作为局部性参数,其并通过将程序局部性原理应用到程序分配中,有效的提高...
- 伍卫国刘松谢骁崔元桢邹年俊
- 一种针对由异构存储设备组成的对象存储系统的对象分布算法
- 本发明提供一种针对由异构存储设备组成的对象存储系统的对象分布算法:1)将异构存储系统中的各个对象存储设备按照容量和性能分别进行量化后映射至两个环形有限值域上,得到容量型环形空间和性能型环形空间;2)根据待读取对象确定所述...
- 聂世强伍卫国崔金华刘松胡壮薛尚山邹年俊
- 一种基于机器学习的循环分块大小选择方法
- 本发明提供一种基于机器学习的循环分块大小选择方法,针对原始DOALL循环进行合成程序构造,通过列下标元组的全排列使合成程序中的n层嵌套循环的特征值全面覆盖到原始程序以及真实应用程序中的循环;通过对n层嵌套循环变换得到的2...
- 伍卫国刘松崔元桢蒋庆谢骁邹年俊
- 文献传递
- 一种卷积神经网络图像处理系统及方法
- 本发明公开了一种卷积神经网络图像处理系统及方法,利用中央处理单元CPU将NPU单元程序通过全局总线载入到NPU单元的程序存储器,NPU单元根据NPU单元程序通过局部总线读入CMOS图象传感器像素阵列单元数据,然后与中央处...
- 李文胜伍卫国刘松
- 文献传递
- 一种卷积神经网络图像处理系统及方法
- 本发明公开了一种卷积神经网络图像处理系统及方法,利用中央处理单元CPU将NPU单元程序通过全局总线载入到NPU单元的程序存储器,NPU单元根据NPU单元程序通过局部总线读入CMOS图象传感器像素阵列单元数据,然后与中央处...
- 李文胜伍卫国刘松
- 一种群体核酸测试混合装置及方法
- 本发明公开了一种群体核酸测试混合装置及方法,包括采样瓶定位放置盘、混合瓶放置盘、消毒装置、自动吸取装置以及用于自动吸取装置定位转动的旋转控制台,将采样瓶定位放置盘、混合瓶放置盘和消毒装置固定于旋转控制台一侧,在采样瓶定位...
- 李文胜伍卫国刘松
- 文献传递
- 一种面向GPU上模板计算程序的动态混合分块方法及系统
- 本发明公开了一种面向GPU上模板计算程序的动态混合分块方法及系统,首先对多空间维的模板计算程序时间维和最外层空间维选定一种静态循环分块方法,以此方法进行时间维和外层空间维的静态分块;以遍历的方式确定近似最优的静态分块大小...
- 刘松张增源王涛伍卫国
- 一种利用时间局部性的格子玻尔兹曼方法并行加速方法
- 本发明提供了一种利用时间局部性的格子玻尔兹曼方法并行加速方法,包括步骤:1)将单时间迭代步内的三个空间维的DOALL循环融合成一个DOACROSS循环;2)对融合后的DOACROSS循环执行循环偏斜,消除与时间维相关的负...
- 伍卫国刘松邹年俊崔元桢谢骁屈彬
- 文献传递