11赞

Centos6.5下部署Hadoop2.2的完全分布式集群

作者：保佑欣疼你的芯疼 | 2021-09-03 19:48

我们来看下，如何在Centos6.5下，部署完全分布式集群。下面先来看下具体的系统环境序号名称描述1系统环境Centos6.5最好在linux上部署2

我们来看下，如何在Centos6.5下，部署完全分布式集群。
下面先来看下具体的系统环境

序号	名称	描述
1	系统环境Centos6.5	最好在linux上部署
2	Hadoop版本Hadoop2.2.0	Hadoop2.x中的第一个稳定版本
3	JAVA环境JDK1.7	64位(build 1.7.0_25-b15)

部署情况

序号	IP地址	节点名
1	192.168.46.28	hp1(master)
2	192.168.46.29	hp2(slave)
3	192.168.46.30	hp3(slave)

部署步骤

序号	操作
1	配置SSH无密码登陆
2	配置环境变量JAVA(必须),MAVEN,ANT
3	配置Hadoop环境变量
4	配置core-site.xml文件
5	配置hdfs-site.xml文件
6	配置mapred-site.xml文件
7	配置yarn-site.xml文件
8	配置slaves文件
9	分发到从机上
10	在每台机器上格式化namenode
11	启动集群sbin/start-all.sh
12	执行jps命令，查询master与slave的java进程
13	测试页面访问，集群状态信息,
14	可以测试一个MR作业，验证集群

1，首先我们的集群之间的ssh是信任的，方便hadoop进程之间的通信。

生成公钥：ssh-keygen -t rsa -P ''
拷贝信任:ssh-copy-id .ssh/id_rsa.pub root@hp2
2，配置各种环境变量包括java，maven，ant，hadoop等的变量，代码如下：

export PATH=.:$PATH

export JAVA_HOME="/usr/local/jdk"
export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
export PATH=$PATH:$JAVA_HOME/bin

export HADOOP_HOME=/root/hadoop
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export CLASSPATH=.:$CLASSPATH:$HADOOP_HOME/lib
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

export ANT_HOME=/usr/local/ant
export CLASSPATH=$CLASSPATH:$ANT_HOME/lib
export PATH=$PATH:$ANT_HOME/bin

export MAVEN_HOME="/usr/local/maven"
export CLASSPATH=$CLASSPATH:$MAVEN_HOME/lib
export PATH=$PATH:$MAVEN_HOME/bin

3，配置core-site.xml文件








      
        fs.default.name  
        hdfs://192.168.46.28:9000  
      
  
    hadoop.tmp.dir
    /root/hadoop/tmp

4,配置hdfs-site.xml文件








  
   dfs.replication  
   1  
   

   
   dfs.namenode.name.dir  
   /root/hadoop/nddir  
   


   
   dfs.datanode.data.dir  
   /root/hadoop/dddir  
   

  
  dfs.permissions  
  false

配置mapred-site.xml文件









mapred.job.tracker
hp1:8021
true
The host and port that the MapReduce JobTracker runs at. 

  
    mapreduce.cluster.temp.dir  
      
    No description  
    true  
    
  
    
    mapreduce.cluster.local.dir  
      
    No description  
    true

配置yarn-site.xml文件






yarn.nodemanager.aux-services
mapreduce_shuffle



yarn.nodemanager.aux-services.mapreduce.shuffle.class
org.apache.hadoop.mapred.ShuffleHandler



Yarn.nodemanager.aux-services
mapreduce.shuffle



yarn.resourcemanager.address
hp1:8032



yarn.resourcemanager.scheduler.address
hp1:8030



yarn.resourcemanager.resource-tracker.address
hp1:8031



yarn.resourcemanager.admin.address
hp1:8033



yarn.resourcemanager.webapp.address
hp1:8088

配置slaves文件

192.168.46.28
192.168.46.29
192.168.46.30

配置好后，注意，在hdfs-site.xml文件里的目录，需要自己在hadoop根目录下创建，以及hadoop的HDFS的tmp目录。一切做好之后，我们就可以分发整套hadoop到从机上，然后格式化namenode，并启动集群，使用jps在主机，和从机上分别显示如下：
master的jps显示如下：

4335 SecondaryNameNode
4464 ResourceManager
4553 NodeManager
4102 NameNode
4206 DataNode
6042 Jps

slave上的jps显示如下:

1727 DataNode
1810 NodeManager
2316 Jps

确实jps命令显示的java进程正确，我们就可以访问，web界面进行查看了，截图如下：

至此，我们已经成功的部署完成hadoop集群，安装时，注意散仙的步骤，按这样顺序来，一般不容易不错。

推荐阅读

程序员
Safari自动"display:none!important"不会加载图片

如何解决《Safari自动"display:none!important"不会加载图片》经验，为你挑选了1个好方法。 ... [详细]
程序员
理解Beautiful Soup中的Find()函数

如何解决《理解BeautifulSoup中的Find()函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么`getNumPartitions()`没有给我"repartition"指定的正确数量的分区？

如何解决《为什么`getNumPartitions()`没有给我"repartition"指定的正确数量的分区？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在页面刷新时保留Chrome DOM断点？

如何解决《如何在页面刷新时保留ChromeDOM断点？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Web Audio API中AudioWorkerNode的状态

如何解决《WebAudioAPI中AudioWorkerNode的状态》经验，为你挑选了1个好方法。 ... [详细]
程序员
Loop没有捕获重复项并在Android(Java)中删除它们

如何解决《Loop没有捕获重复项并在Android(Java)中删除它们》经验，为你挑选了0个好方法。 ... [详细]
程序员
我应该为我写的每一个javascript函数'使用严格'吗？

如何解决《我应该为我写的每一个javascript函数'使用严格'吗？》经验，为你挑选了3个好方法。 ... [详细]
程序员
在facebook sdk服务文件上启用压缩以优化网站

如何解决《在facebooksdk服务文件上启用压缩以优化网站》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何为eclipse安装最新版本的ADT插件

如何解决《如何为eclipse安装最新版本的ADT插件》经验，为你挑选了2个好方法。 ... [详细]
程序员
在Swift(iOS应用程序)中,何时需要使用其他整数类型？

如何解决《在Swift(iOS应用程序)中,何时需要使用其他整数类型？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用node.js将查询字符串参数传递给Smartsheet API？

如何解决《如何使用node.js将查询字符串参数传递给SmartsheetAPI？》经验，为你挑选了1个好方法。 ... [详细]
程序员
TensorFlow LSTM生成模型

如何解决《TensorFlowLSTM生成模型》经验，为你挑选了1个好方法。 ... [详细]
程序员
Double Sapply嵌套功能

如何解决《DoubleSapply嵌套功能》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在不嵌套其他容器的情况下垂直对齐内容？

如何解决《如何在不嵌套其他容器的情况下垂直对齐内容？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Bash脚本中隐藏输出

如何解决《在Bash脚本中隐藏输出》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从Google Apps脚本项目属性中存储和检索对象？

如何解决《如何从GoogleApps脚本项目属性中存储和检索对象？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Qt C++我怎么不用信号垃圾邮件我的UI线程

如何解决《QtC++我怎么不用信号垃圾邮件我的UI线程》经验，为你挑选了1个好方法。 ... [详细]
程序员
与Docker共享设备(网络摄像头,USB驱动器等)

如何解决《与Docker共享设备(网络摄像头,USB驱动器等)》经验，为你挑选了2个好方法。 ... [详细]
程序员
在Laravel中征服意见

如何解决《在Laravel中征服意见》经验，为你挑选了1个好方法。 ... [详细]
程序员
d3.js:从时间尺度获取刻度格式

如何解决《d3.js:从时间尺度获取刻度格式》经验，为你挑选了0个好方法。 ... [详细]

保佑欣疼你的芯疼

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章