您的位置: 专家智库 > >

国家自然科学基金(61173039)

作品数:8 被引量:24H指数:2
相关作者:董小社朱正东王寅峰张兴军刘袁更多>>
相关机构:西安交通大学深圳信息职业技术学院深圳职业技术学院更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家科技支撑计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 8篇中文期刊文章

领域

  • 8篇自动化与计算...

主题

  • 2篇调度
  • 2篇异构
  • 2篇云计算
  • 2篇架构
  • 2篇GPU
  • 1篇调度方法
  • 1篇调度机制
  • 1篇迭代
  • 1篇迭代式
  • 1篇多核
  • 1篇多核架构
  • 1篇多任务
  • 1篇虚拟处理器
  • 1篇虚拟化
  • 1篇虚拟机
  • 1篇虚拟机管理器
  • 1篇异构多核
  • 1篇映射
  • 1篇映射方法
  • 1篇删除

机构

  • 8篇西安交通大学
  • 2篇深圳信息职业...
  • 1篇深圳职业技术...

作者

  • 8篇董小社
  • 5篇朱正东
  • 3篇王寅峰
  • 2篇刘超
  • 2篇张兴军
  • 2篇李亮
  • 2篇颜康
  • 2篇刘袁
  • 1篇王龙翔
  • 1篇陈衡
  • 1篇张保
  • 1篇曹海军
  • 1篇白秀秀
  • 1篇周墨颂
  • 1篇刘强
  • 1篇朱国峰
  • 1篇朱跃光
  • 1篇魏洪昌
  • 1篇王强

传媒

  • 5篇西安交通大学...
  • 2篇计算机学报
  • 1篇计算机工程与...

年份

  • 4篇2015
  • 2篇2014
  • 2篇2013
8 条 记 录,以下是 1-8
排序方式:
面向异构多核架构的自适应编译框架被引量:2
2014年
针对应用在移植到异构多核高性能计算机系统中所面临的可移植性差以及性能优化难度大的问题,文中提出一种面向异构多核架构的自适应编译框架.通过源到源编译解决传统并行编程模型应用向异构多核架构的映射问题;同时利用动态剖分信息,自适应地调整插桩并配置优化策略,形成迭代式的自动优化过程.文中自适应编译框架将软硬件映射机制与优化策略结合,有效地解决了同构并行应用向异构多核架构的移植问题并提高了应用的整体性能.实验结果表明,文中基于Cell架构实现的原型系统,很好地解决了异构多核架构下应用移植性等问题,同时应用性能有所提高.
白秀秀董小社刘超曹海军李亮
关键词:异构多核插桩
面向CPU-GPU架构的源到源自动映射方法被引量:2
2015年
针对GPU上应用开发移植困难的问题,提出了一种串行计算源程序到并行计算源程序的映射方法。该方法从串行源程序中获得可并行化循环的层次信息,建立循环体结构与GPU线程的对应关系,生成GPU端核心函数代码;根据变量引用读写属性生成CPU端控制代码。基于该方法实现了一个编译原型系统,完成了C语言源程序到CUDA源程序的自动生成。对原型系统在功能和性能方面的测试结果表明,该系统生成的CUDA源程序与C语言源程序在功能上一致,其性能有显著提高,在一定程度上解决了计算密集型应用向CPU-GPU异构多核系统移植困难的问题。
朱正东刘袁魏洪昌颜康王寅峰董小社
关键词:自动映射
基于I/O受限进程识别的虚拟处理器调度机制
2015年
针对多核平台的虚拟化环境中客户机与虚拟机管理器(virtual machine monitor,VMM)之间语义缝隙造成客户机I/O性能下降的问题,提出了一种基于I/O受限进程识别的虚拟处理器(virtual CPU,vCPU)调度机制。该机制在客户机内部利用推断技术识别I/O受限进程,通过客户机与VMM的协作实现I/O事件与I/O受限进程的关联,利用保证客户机之间公平性的虚拟对称多核处理器(virtual symmetric multi-core processor,vSMP)Internal调度算法,优先调度与I/O事件关联的I/O受限进程所在的vCPU来桥接客户机与VMM之间的语义缝隙,提高拥有vSMP的客户机中I/O负载性能。测试结果表明,相比于KVM虚拟化环境的CFS调度机制,该机制可以在保证客户机CPU公平性的前提下,有效提升运行混合负载的vSMP客户机中I/O负载性能,同时只增加较小的客户机额外开销,可以应用在负载多样性和不可预测性的虚拟桌面和云计算环境中。
王强董小社王恩东朱正东
关键词:虚拟化虚拟机管理器
采用资源划分的云环境下Hadoop资源许可调度方法被引量:1
2015年
针对云计算环境中Hadoop平台由于节点计算能力差异、多样混合负载共存等原因而出现的性能不佳的问题,提出一种采用资源划分的资源许可方法。该方法在云计算环境下通过减少资源浪费或负载过重等情况的出现来提高系统性能。该方法采集资源信息并推测任务资源需求,根据可用计算资源和任务需求动态划分、调度资源;使用与资源无耦合的资源许可启动任务并控制任务数量调节资源利用率以适应云环境。使用该方法对比公平调度器在国家高性能计算中心(西安)进行测试发现:单作业在资源竞争环境中优于公平调度器的静态结果;混合负载在3种测试环境中完成时间分别平均减少了27.5%、37.1%和50.98%,性能显著提升。实验结果表明,该方法可以适应负载资源需求和可用计算资源的变化,灵活划分计算资源,解决Hadoop在云环境中的性能不佳问题。
周墨颂朱正东董小社陈衡王寅峰
关键词:云计算HADOOP作业调度
应用动态生成树的GPU显存数据复用优化被引量:1
2013年
针对手工优化GPU(Graphic Processing Unit)显存级数据复用过程复杂和编译时优化数据复用开销过大的问题,提出了一种基于动态生成树在运行时进行数据复用的优化方法,可为程序员提供一种透明且高效简单的优化方式.该方法将已经执行的GPU计算任务的数据访问抽象为生成树的叶子节点,利用动态生成树管理GPU数据访问信息,实现了运行时GPU显存级数据的复用优化,并通过运行时对生成树的搜索和维护,动态地发掘和优化GPU显存级数据复用,因此,在编程时不需要进行复杂且困难的数据复用分析,直接调用文中提出的运行时库就能有效减少程序执行过程中CPU内存和GPU显存之间的冗余数据传输次数,从而提升应用的运行性能.实验结果表明,使用文中提出的优化方法可有效消除未进行数据复用优化的CPU-GPU应用程序中的冗余数据传输,最大加速比达原始执行的3~10倍,额外开销不到优化后程序总执行时间的5%.
李亮王恩东朱正东颜康张保董小社
关键词:数据复用数据传输
重复数据删除中的无向图遍历分组预测方法被引量:5
2013年
针对重复数据删除系统中存储容量受内存限制难以进行扩展的问题,提出了一种基于无向图遍历的重复数据删除分组预测方法。该方法将索引表保存在磁盘中,并在内存中维护索引表缓存,以此提高系统最大可支持的存储容量。对于索引表缓存命中率低、系统性能差的问题,采用了图遍历分组方法予以解决,根据数据块访问序列特征信息建立无向图并进行分析,基于分析结果对索引项进行分组,并以组进行缓存替换,从而提高缓存命中率和系统性能。实验结果表明,基于缓存预取原理和无向图遍历分组,在将缓存设置为索引表大小的10%时,重复数据删除存储系统最大存储容量比原有方法提高了7.5倍,缓存命中率由不进行索引项分组时的47%提高到87.6%。
王龙翔张兴军朱国峰朱跃光董小社
关键词:重复数据删除
面向GPU异构并行系统的多任务流编程模型被引量:11
2014年
传统并行编程模型和框架不能有效利用和发挥GPU异构并行系统特点,应用开发难度大,性能优化困难,文中采用混合编程模型思想,建立了一种以协处理器为中心的GPU计算核心与CPU控制相融合的多任务流编程模型.模型将并行任务与CUDA流相结合,利用系统硬件并行性特点实现程序任务级和数据级并行;采用任务间消息通信和任务内数据共享通信方式,既保证对传统并行应用的继承又降低了不同存储空间给应用开发带来的复杂性和难度.基于该编程模型实现了一个运行时支持系统原型,测试结果表明可保证高效的数据通信,且能充分利用系统计算能力,提高了应用程序运行效率.
董小社刘超王恩东刘袁张兴军
关键词:GPU编程模型
一种短作业环境下的延迟调度算法被引量:2
2015年
针对短作业场景下YARN平台中延迟调度算法基于静态时间等待阈值,不能进行合理等待的问题,提出了一种云计算环境中基于本地性资源预测的延迟调度算法(locality resource forecast delay scheduling,LRFD)。该算法综合考虑短作业和资源可用性动态变化的特点进行任务调度,根据节点上任务的完成进度和作业未处理数据在集群中的分布状况预估作业的本地性资源信息,从而判断是否需要进行等待以提高系统性能,实现了对本地性资源的合理等待。实验结果表明:在短作业场景下,LRFD算法的性能和稳定性均优于已有的延迟算法,作业性能平均提升约10%,最大加速比可达3倍以上。
刘强董小社朱正东王寅峰
关键词:云计算
共1页<1>
聚类工具0