11赞

当前位置: 开发笔记 > 大数据 > 正文

手动安装cloudera cdh4.2 hadoop + hbase + hive（一）

作者：云聪京初瑞子_617 | 2021-09-09 09:17

安装版本hadoop-2.0.0-cdh4.2.0hbase-0.94.2-cdh4.2.0hive-0.10.0-cdh4.2.0jdk1.6.0_38安装前说明安装目录为opt检查hosts文件关闭防火墙设置时钟同步使用说明安装hadoop、hbase、hive成功之后启动方式为：启动dfs和mapreducedesktop1上执行start-

安装版本 hadoop-2.0.0-cdh4.2.0hbase-0.94.2-cdh4.2.0hive-0.10.0-cdh4.2.0jdk1.6.0_38 安装前说明安装目录为/opt 检查hosts文件关闭防火墙设置时钟同步使用说明安装hadoop、hbase、hive成功之后启动方式为：启动dfs和mapreduce desktop1上执行start-

安装版本

hadoop-2.0.0-cdh4.2.0
hbase-0.94.2-cdh4.2.0
hive-0.10.0-cdh4.2.0
jdk1.6.0_38

安装前说明

安装目录为/opt
检查hosts文件
关闭防火墙
设置时钟同步

使用说明

安装hadoop、hbase、hive成功之后启动方式为：

启动dfs和mapreduce desktop1上执行start-dfs.sh和start-yarn.sh
启动hbase desktop3上执行start-hbase.xml
启动hive desktop1上执行hive

规划

    192.168.0.1             NameNode、Hive、ResourceManager
    192.168.0.2             SSNameNode
    192.168.0.3             DataNode、HBase、NodeManager
    192.168.0.4             DataNode、HBase、NodeManager
    192.168.0.6             DataNode、HBase、NodeManager
    192.168.0.7             DataNode、HBase、NodeManager
    192.168.0.8             DataNode、HBase、NodeManager

部署过程

系统和网络配置

修改每台机器的名称

[root@desktop1 ~]# cat /etc/sysconfig/network
NETWORKING=yes
HOSTNAME=desktop1

在各个节点上修改/etc/hosts增加以下内容:

[root@desktop1 ~]# cat /etc/hosts
127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
192.168.0.1     desktop1
192.168.0.2     desktop2
192.168.0.3     desktop3
192.168.0.4     desktop4
192.168.0.6     desktop6
192.168.0.7     desktop7
192.168.0.8     desktop8

配置ssh无密码登陆以下是设置desktop1上可以无密码登陆到其他机器上。

    [root@desktop1 ~]# ssh-keygen
    [root@desktop1 ~]# ssh-copy-id -i .ssh/id_rsa.pub desktop2
    [root@desktop1 ~]# ssh-copy-id -i .ssh/id_rsa.pub desktop3
    [root@desktop1 ~]# ssh-copy-id -i .ssh/id_rsa.pub desktop4
    [root@desktop1 ~]# ssh-copy-id -i .ssh/id_rsa.pub desktop6
    [root@desktop1 ~]# ssh-copy-id -i .ssh/id_rsa.pub desktop7
    [root@desktop1 ~]# ssh-copy-id -i .ssh/id_rsa.pub desktop8

每台机器上关闭防火墙：

    [root@desktop1 ~]# service iptables stop

安装Hadoop

配置Hadoop

将jdk1.6.0_38.zip上传到/opt，并解压缩。将hadoop-2.0.0-cdh4.2.0.zip上传到/opt，并解压缩。

在NameNode上配置以下文件：

core-site.xml fs.defaultFS指定NameNode文件系统，开启回收站功能。
hdfs-site.xml 
    dfs.namenode.name.dir指定NameNode存储meta和editlog的目录，
    dfs.datanode.data.dir指定DataNode存储blocks的目录，
    dfs.namenode.secondary.http-address指定Secondary NameNode地址。
    开启WebHDFS。
slaves 添加DataNode节点主机

core-site.xml 该文件指定fs.defaultFS连接desktop1，即NameNode节点。

[root@desktop1 hadoop]# pwd
/opt/hadoop-2.0.0-cdh4.2.0/etc/hadoop
[root@desktop1 hadoop]# cat core-site.xml 





     fs.defaultFS
         
     hdfs://desktop1


fs.trash.interval
10080


fs.trash.checkpoint.interval
10080

hdfs-site.xml 该文件主要设置数据副本保存份数，以及namenode、datanode数据保存路径以及http-address。

[root@desktop1 hadoop]# cat hdfs-site.xml 




  dfs.replication
  1



  hadoop.tmp.dir
  /opt/data/hadoop-${user.name}



dfs.namenode.http-address
desktop1:50070



dfs.namenode.secondary.http-address
desktop2:50090



dfs.webhdfs.enabled
true

masters 设置namenode和secondary namenode节点。

[root@desktop1 hadoop]# cat masters 
desktop1
desktop2

slaves 设置哪些机器上安装datanode节点。

[root@desktop1 hadoop]# cat slaves 
desktop3
desktop4
desktop6
desktop7
desktop8

配置MapReduce

mapred-site.xml 配置使用yarn计算框架，以及jobhistory的地址。

[root@desktop1 hadoop]# cat mapred-site.xml




 mapreduce.framework.name
 yarn



 mapreduce.jobhistory.address
 desktop1:10020



 mapreduce.jobhistory.webapp.address
 desktop1:19888

yarn-site.xml 主要配置resourcemanager地址以及yarn.application.classpath（这个路径很重要，要不然集成hive时候会提示找不到class）

[root@desktop1 hadoop]# cat yarn-site.xml 



    yarn.resourcemanager.resource-tracker.address
    desktop1:8031
  
  
    yarn.resourcemanager.address
    desktop1:8032
  
  
    yarn.resourcemanager.scheduler.address
    desktop1:8030
  
  
    yarn.resourcemanager.admin.address
    desktop1:8033
  
  
    yarn.resourcemanager.webapp.address
    desktop1:8088
  
  
    Classpath for typical applications.
    yarn.application.classpath
    $HADOOP_CONF_DIR,$HADOOP_COMMON_HOME/share/hadoop/common/*,
    $HADOOP_COMMON_HOME/share/hadoop/common/lib/*,
    $HADOOP_HDFS_HOME/share/hadoop/hdfs/*,$HADOOP_HDFS_HOME/share/hadoop/hdfs/lib/*,
    $YARN_HOME/share/hadoop/yarn/*,$YARN_HOME/share/hadoop/yarn/lib/*,
    $YARN_HOME/share/hadoop/mapreduce/*,$YARN_HOME/share/hadoop/mapreduce/lib/*
  
  
    yarn.nodemanager.aux-services
    mapreduce.shuffle
  
  
    yarn.nodemanager.aux-services.mapreduce.shuffle.class
    org.apache.hadoop.mapred.ShuffleHandler
  

  
    yarn.nodemanager.local-dirs
    /opt/data/yarn/local
  
  
    yarn.nodemanager.log-dirs
    /opt/data/yarn/logs
  
  
    Where to aggregate logs
    yarn.nodemanager.remote-app-log-dir
    /opt/data/yarn/logs
  

  
    yarn.app.mapreduce.am.staging-dir
    /user

同步配置文件

修改.bashrc环境变量，并将其同步到其他几台机器，并且source .bashrc

[root@desktop1 ~]# cat .bashrc 
# .bashrc
alias rm='rm -i'
alias cp='cp -i'
alias mv='mv -i'

# Source global definitions
if [ -f /etc/bashrc ]; then
        . /etc/bashrc
fi
# User specific environment and startup programs
export LANG=zh_CN.utf8

export JAVA_HOME=/opt/jdk1.6.0_38
export JRE_HOME=$JAVA_HOME/jre
export CLASSPATH=./:$JAVA_HOME/lib:$JRE_HOME/lib:$JRE_HOME/lib/tools.jar

export HADOOP_HOME=/opt/hadoop-2.0.0-cdh4.2.0
export HIVE_HOME=/opt/hive-0.10.0-cdh4.2.0
export HBASE_HOME=/opt/hbase-0.94.2-cdh4.2.0

export HADOOP_MAPRED_HOME=${HADOOP_HOME}
export HADOOP_COMMON_HOME=${HADOOP_HOME}
export HADOOP_HDFS_HOME=${HADOOP_HOME}
export YARN_HOME=${HADOOP_HOME}
export HADOOP_YARN_HOME=${HADOOP_HOME}
export HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop
export HDFS_CONF_DIR=${HADOOP_HOME}/etc/hadoop
export YARN_CONF_DIR=${HADOOP_HOME}/etc/hadoop

export PATH=$PATH:$HOME/bin:$JAVA_HOME/bin:$HADOOP_HOME/sbin:$HBASE_HOME/bin:$HIVE_HOME/bin

修改配置文件之后，使其生效。

[root@desktop1 ~]# source .bashrc

将desktop1上的/opt/hadoop-2.0.0-cdh4.2.0拷贝到其他机器上

启动脚本

第一次启动hadoop需要先格式化NameNode，该操作只做一次。当修改了配置文件时，需要重新格式化

[root@desktop1 hadoop]hadoop namenode -format

在desktop1上启动hdfs：

[root@desktop1 hadoop]#start-dfs.sh

在desktop1上启动mapreduce：

[root@desktop1 hadoop]#start-yarn.sh

在desktop1上启动historyserver：

[root@desktop1 hadoop]#mr-jobhistory-daemon.sh start historyserver

查看MapReduce：

http://desktop1:8088/cluster

查看节点：

http://desktop2:8042/
http://desktop2:8042/node

检查集群进程

[root@desktop1 ~]# jps
5389 NameNode
5980 Jps
5710 ResourceManager
7032 JobHistoryServer

[root@desktop2 ~]# jps
3187 Jps
3124 SecondaryNameNode

[root@desktop3 ~]# jps
3187 Jps
3124 DataNode
5711 NodeManager

推荐阅读

程序员
我们如何将变量(字符串)传递给xpath包含函数？

如何解决《我们如何将变量(字符串)传递给xpath包含函数？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java正则表达式返回完整字符串而不是捕获

如何解决《Java正则表达式返回完整字符串而不是捕获》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么$('.classname')&document.getElementsByClassName('classname')返回不同的东西？

如何解决《为什么$('.classname')&document.getElementsByClassName('classname')返回不同的东西？》经验，为你挑选了1个好方法。 ... [详细]
程序员
新线程多次

如何解决《新线程多次》经验，为你挑选了1个好方法。 ... [详细]
程序员
如果四个变量相等

如何解决《如果四个变量相等》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法在xib文件中向UITableView添加PrototypeCell

如何解决《无法在xib文件中向UITableView添加PrototypeCell》经验，为你挑选了2个好方法。 ... [详细]
程序员
SAPUI5 Android App - 资源未加载

如何解决《SAPUI5AndroidApp-资源未加载》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用node.js在Azure文件存储中上载文件

如何解决《使用node.js在Azure文件存储中上载文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
我们可以在ScrollView Xamarin.Forms中隐藏滚动条

如何解决《我们可以在ScrollViewXamarin.Forms中隐藏滚动条》经验，为你挑选了2个好方法。 ... [详细]
程序员
尝试通过ACTION_OPEN_DOCUMENT为自定义DocumentsProvider尝试采用PersistableUriPermission（）失败

如何解决《尝试通过ACTION_OPEN_DOCUMENT为自定义DocumentsProvider尝试采用PersistableUriPermission（）失败》经验，为你挑选了0个好方法。 ... [详细]
程序员
knitr R markdown文档中的mapview错误

如何解决《knitrRmarkdown文档中的mapview错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
在kotlin中使用elvis运算符时如何否定布尔表达式？

如何解决《在kotlin中使用elvis运算符时如何否定布尔表达式？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Django Rest使用用户名或电子邮件登录JWT？

如何解决《DjangoRest使用用户名或电子邮件登录JWT？》经验，为你挑选了1个好方法。 ... [详细]
程序员
卷积中的伪像

如何解决《卷积中的伪像》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何更改Swift标头("ProductModuleName-Swift.h")产品名称作为产品名称动态更改

如何解决《如何更改Swift标头("ProductModuleName-Swift.h")产品名称作为产品名称动态更改》经验，为你挑选了1个好方法。 ... [详细]
程序员
django AdminSplitDateTime有效的日期/时间错误

如何解决《djangoAdminSplitDateTime有效的日期/时间错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
在按钮单击中执行AsyncTask而不会出现崩溃或异常

如何解决《在按钮单击中执行AsyncTask而不会出现崩溃或异常》经验，为你挑选了1个好方法。 ... [详细]
程序员
我可以更改Android自定义键盘的输出字体吗？

如何解决《我可以更改Android自定义键盘的输出字体吗？》经验，为你挑选了0个好方法。 ... [详细]
程序员
我在哪里可以找到有关Google Test的综合文档？

如何解决《我在哪里可以找到有关GoogleTest的综合文档？》经验，为你挑选了2个好方法。 ... [详细]
程序员
以功能方式从列表创建配对列表

如何解决《以功能方式从列表创建配对列表》经验，为你挑选了1个好方法。 ... [详细]

云聪京初瑞子_617

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章