您的位置: 专家智库 > >

杨晓亮

作品数:1 被引量:28H指数:1
供职机构:计算机软件新技术国家重点实验室更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇HADOOP
  • 1篇MAPRED...
  • 1篇并行计算
  • 1篇大数据

机构

  • 1篇计算机软件新...

作者

  • 1篇袁春风
  • 1篇黄宜华
  • 1篇杨晓亮
  • 1篇顾荣

传媒

  • 1篇计算机研究与...

年份

  • 1篇2014
1 条 记 录,以下是 1-1
排序方式:
Hadoop MapReduce短作业执行性能优化被引量:28
2014年
Hadoop MapReduce并行计算框架被广泛应用于大规模数据并行处理.近年来,由于其能较好地处理大规模数据,Hadoop MapReduce也被越来越多地使用在查询应用中.为了能够处理大规模数据集,Hadoop的基本设计更多地强调了数据的高吞吐率.然而在处理对短作业响应性能有较高要求的查询应用时,Hadoop MapReduce并行计算框架存在明显不足.为了提升Hadoop对于短作业的执行效率,对原有的Hadoop MapReduce作出以下3点优化:1)通过优化原有的setup和cleanup任务的执行方式,成功地缩短了作业初始化环境准备和作业结束环境清理的时间;2)将首次任务分配从"拉"模式转变为"推"模式;3)将作业执行过程中JobTracker和TaskTrackers之间的控制消息通信从现有的周期性心跳机制中分离出来,采用即时传递机制.最后,采用一种典型的基于MapReduce并行化的查询应用BLAST,对优化工作进行了评估.各种不同类型BLAST作业的测试实验表明,与现有的标准Hadoop相比,优化后的Hadoop平均执行性能提升约23%.
顾荣严金双杨晓亮袁春风黄宜华
关键词:MAPREDUCE并行计算
共1页<1>
聚类工具0