当前位置:  开发笔记 > 编程语言 > 正文

在Hadoop伪分布式模式下充分利用所有核心

如何解决《在Hadoop伪分布式模式下充分利用所有核心》经验,为你挑选了1个好方法。

我在我的4核笔记本电脑上以伪分布式模式运行任务.如何确保有效使用所有核心.目前,我的工作跟踪器显示一次只执行一项工作.这是否意味着只使用一个核心?

以下是我的配置文件.

CONF /芯-site.xml中:


   
       fs.default.name
       hdfs://localhost:9000
   
 

CONF/HDFS-site.xml中:


  
       dfs.replication
       1
  

CONF/mapred-site.xml中:


   
        mapred.job.tracker
        localhost:9001  
   


编辑:根据答案,我需要在mapred-site.xml中添加以下属性

 
     mapred.map.tasks 
     4 
  
  
     mapred.reduce.tasks 
     4 
  

Praveen Srip.. 6

mapreduce.tasktracker.map.tasks.maximummapreduce.tasktracker.reduce.tasks.maximum属性控制每个节点的map和reduce任务的数量.对于4核处理器,从2/2开始,然后根据需要更改值.slot是map或reduce slot,将值设置为4/4将使Hadoop框架同时启动4个map和4个reduce任务.在节点上一次运行总共8个map和reduce任务.

mapred.map.tasksmapred.reduce.tasks属性控制作业的map/reduce任务总数,而不是每个节点的任务数.此外,还有mapred.map.tasksHadoop框架的提示,作业的总映射任务数等于InputSplits的数量.



1> Praveen Srip..:

mapreduce.tasktracker.map.tasks.maximummapreduce.tasktracker.reduce.tasks.maximum属性控制每个节点的map和reduce任务的数量.对于4核处理器,从2/2开始,然后根据需要更改值.slot是map或reduce slot,将值设置为4/4将使Hadoop框架同时启动4个map和4个reduce任务.在节点上一次运行总共8个map和reduce任务.

mapred.map.tasksmapred.reduce.tasks属性控制作业的map/reduce任务总数,而不是每个节点的任务数.此外,还有mapred.map.tasksHadoop框架的提示,作业的总映射任务数等于InputSplits的数量.

推荐阅读
云聪京初瑞子_617
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有