孙荪
- 作品数:6 被引量:7H指数:2
- 供职机构:中国科学技术大学计算机科学与技术学院更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 提高多核处理器片上Cache利用率的关键技术研究
- 硬件高速缓存能够充分利用指令和数据的局部性特征,提前将所需的指令和数据放至高速的缓存设备来减小访存延迟。目前的体系结构设计能力和工艺水平已经能够将大容量高速缓存集成至片内以缓解访存带宽和速度对系统性能的影响。随着多核与片...
- 孙荪
- 关键词:多核处理器高速缓存线程调度电路设计
- 文献传递
- 基于分布式模拟机制的片上网络硬件模拟系统被引量:1
- 2016年
- 针对基于现场可编程门阵列的DART模拟器可扩展性较差和模拟精度较低的问题,提出一种硬件友好的分布式模拟机制。该机制在模拟中采用隐式同步方法,以节点内计数器和节点间缓冲队列取代集中式控制器,将时序同步和计数任务交给每个节点自行处理,从而提高模拟速度。基于该机制,设计并实现片上网络硬件模拟系统。实验结果表明,该系统能达到与业界权威BookSim模拟器同级别的模拟精度,模拟速度可达BookSim模拟器的200倍,相比DART模拟器能获得21%的速度提升,并且具有较好的扩展性。
- 彭毅安虹金旭程亦超迟孟贤孙荪
- 关键词:片上网络分布式模拟现场可编程门阵列多核处理器
- 一种带多级Cache的SIMD众核处理器上的稀疏矩阵存储方法
- 本发明公开了一种带多级Cache的SIMD众核处理器上的稀疏矩阵存储方法,包括:(1)获取矩阵A中行非零元个数最大值a,处理器SIMD单元可同时计算的非零元个数b,计算大于a且为b的倍数的最小值作为临时行宽度;(2)对矩...
- 韩文廷张爱民江霞安虹陈俊仕孙荪汪朝辉
- 利用访存负载平衡提高多核处理器系统吞吐量被引量:1
- 2014年
- 多任务并行执行是发挥多核处理器效能的常用手段,对多任务进行有效调度从而避免资源使用瓶颈是多核处理器任务调度的一个重要课题.本文针对多核处理器片上存储资源的使用提出一个访存负载平衡调度机制,通过刻画任务访存负载、操作系统内核层性能检测,实现了集成的计算和访存负载协同平衡系统.该调度系统在区分任务访存特征的基础上,可以在操作系统内核层组织任务执行.通过对测试程序集合的实验验证,并与其它两种调度算法进行比较,相对于操作系统缺省的计算负载平衡机制,访存负载平衡调度系统可以提高多核处理器任务吞吐量达8.2%,并且具有较低的系统实现开销.
- 刘玉安虹孙荪陈俊仕
- 关键词:多核处理器系统吞吐量
- CPU-GPU融合架构上的缓存性能分析与优化被引量:3
- 2017年
- 现今CPU和GPU的发展已经出现新的瓶颈,将两者"结合"在同一块芯片上成为一种新的趋势。这种新的异构架构给片上共享资源的管理带来压力。而共享末级缓存(LLC)的管理对性能的影响非常关键。由于CPU程序和GPU程序的不同特性,给CPU和GPU间共享的末级缓存管理带来新的挑战。通过分析GPU程序访存特征,借鉴之前的缓存管理方案,提出对CPU-GPU融合系统的末级缓存进行等量的静态划分和最优静态划分的方案。实验结果表明:通过缓存划分可以有效避免CPU和GPU程序间的干扰。与传统LRU策略相比,等量静态划分和最优静态划分可以使系统整体性能分别提高7.68%和11.62%。
- 孙传伟安虹孙荪陈俊仕
- 一种带多级Cache的SIMD众核处理器上的稀疏矩阵存储方法
- 本发明公开了一种带多级Cache的SIMD众核处理器上的稀疏矩阵存储方法,包括:(1)获取矩阵A中行非零元个数最大值a,处理器SIMD单元可同时计算的非零元个数b,计算大于a且为b的倍数的最小值作为临时行宽度;(2)对矩...
- 韩文廷张爱民江霞安虹陈俊仕孙荪汪朝辉
- 文献传递