6赞

当前位置: 开发笔记 > 运维 > 正文

Hadoop1.2中配置伪分布式的实例

作者：135369一生真爱_890 | 2022-12-01 12:52

这篇文章主要介绍了Hadoop1.2中配置伪分布式的实例,使用的系统是linuxmint1564bit，hadoop使用的是1.2.1版本,需要的朋友可以参考下

1、设置ssh

安装ssh相关软件包：

复制代码代码如下:

sudo apt-get install openssh-client openssh-server

然后使用下面两个命令之一启动/关闭sshd：

复制代码代码如下:

sudo /etc/init.d/ssh start|stop
sudo service ssh start|stop

若成功启动sshd，我们能看到如下类似结果：

复制代码代码如下:

$ ps -e | grep ssh
 2766 ?        00:00:00 ssh-agent
10558 ?        00:00:00 sshd

这时候，如果运行如下ssh登录本机的命令，会提示输入密码：

复制代码代码如下:

ssh localhost

现在我们要做的就是让它不需要输入密码：

复制代码代码如下:

$ ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa  #一个空密码的SSH密钥
$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

这样的话就行了。如果仍不凑效，可能是密钥文件的权限设置不当。

2、配置hadoop

将hadoop-1.2.1解压到~/下，同时在~/下建立目录hadoop-env，继续在hadoop-env下建立如下的目录结构：

├── dfs
│   ├── checkpoint1
│   ├── data1
│   ├── data2
│   └── name1
└── test
    └── input
配置文件hadoop-1.2.1/conf/core-site.xml：

复制代码代码如下:

  
    fs.default.name
    hdfs://localhost:9000
    true
  

fs.default.name来指定HDFS的uri，如果value中没有提供端口，默认为8020。

配置文件hadoop-1.2.1/conf/hdfs-site.xml：

复制代码代码如下:

  
    dfs.name.dir
    ~/hadoop-env/dfs/name1
    true
  
  
    dfs.data.dir
    ~/hadoop-env/dfs/data1,~/hadoop-env/dfs/data2
    true
  
  
    fs.checkpoint.dir
    ~/hadoop-env/dfs/checkpoint1
    true
  

dfs.name.dir指定namenode存储元数据的目录，可以指定多个目录，这些目录要用逗号分开；dfs.data.dir指定datanode存放数据的目录，可以指定多个目录；fs.checkpoint.dir指定辅助namenode存放检查点的目录。

配置文件hadoop-1.2.1/conf/mapred-site.xml：

复制代码代码如下:

  
    mapred.job.tracker
    localhost:9001
    true
  

3、测试

先格式化HDFS：

复制代码代码如下:

./hadoop-1.2.1/bin/hadoop namenode -format

启动HDFS和MapReduce进程：

复制代码代码如下:

$ ./hadoop-1.2.1/bin/start-dfs.sh
$ ./hadoop-1.2.1/bin/start-mapred.sh

启动时候如果报错，例如localhost: Error: JAVA_HOME is not set.，需要在./hadoop-1.2.1/conf/hadoop-env.sh文件中export JAVA_HOME，例如：

export JAVA_HOME=~/jdk1.7.0_25
如何检查是否成功启动了：第一种方法是使用jps命令（Java Virtual Machine Process Status Tool），应该有如下类似输出：

复制代码代码如下:

$ jps
DataNode
SecondaryNameNode
JobTracker
NameNode
TaskTracker
Jps

第二种方法是浏览器登录http://localhost:50030查看jobtracker，http://localhost:50070查看namenode。如果在使用翻墙软件，那么在访问时可能会报错，最简单的解决方法是关掉翻墙软件。还有一种方法就是查看日志文件。

现在我们在~/hadoop-env/test/input目录下建立两个文件：

复制代码代码如下:

$ echo "hello world" > test1.txt 
$ echo "hi,world" > test2.txt

把这两个文件导入HDFS：

复制代码代码如下:

./hadoop-1.2.1/bin/hadoop dfs -put hadoop-env/test/input/ output/

查看：

复制代码代码如下:

$ ./hadoop-1.2.1/bin/hadoop dfs -ls /
Found 2 items
drwxr-xr-x - user supergroup 0 2013-10-22 22:07 /test
drwxr-xr-x - user supergroup 0 2013-10-22 21:58 /tmp

$ ./hadoop-1.2.1/bin/hadoop dfs -ls /test
Found 2 items
-rw-r--r-- 3 user supergroup 12 2013-10-22 22:07 /test/test1.txt
-rw-r--r-- 3 user supergroup 9 2013-10-22 22:07 /test/test2.txt

OK，配置完成。

注：本文使用的系统是linux mint 15 64bit，hadoop使用的是1.2.1版本。

推荐阅读

程序员
在C#中打印一些页面不想在浏览器上显示

如何解决《在C#中打印一些页面不想在浏览器上显示》经验，为你挑选了1个好方法。 ... [详细]
程序员
将文件添加到现有zipfile

如何解决《将文件添加到现有zipfile》经验，为你挑选了1个好方法。 ... [详细]
程序员
查询什么都不返回

如何解决《查询什么都不返回》经验，为你挑选了1个好方法。 ... [详细]
程序员
在dplyr中筛选专门包含特定值组合的组

如何解决《在dplyr中筛选专门包含特定值组合的组》经验，为你挑选了1个好方法。 ... [详细]
程序员
快速算法查找矩形内的所有点

如何解决《快速算法查找矩形内的所有点》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何懒惰地在monad中构建Haskell列表？

如何解决《如何懒惰地在monad中构建Haskell列表？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么我需要在SaveChanges之前更改绑定源位置

如何解决《为什么我需要在SaveChanges之前更改绑定源位置》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在Django中为密码不可用的用户允许重置密码？

如何解决《如何在Django中为密码不可用的用户允许重置密码？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Azure REST API - 用于获取所有虚拟机的查询参数

如何解决《AzureRESTAPI-用于获取所有虚拟机的查询参数》经验，为你挑选了1个好方法。 ... [详细]
程序员
通过ng-click将ng-model变量传递给函数

如何解决《通过ng-click将ng-model变量传递给函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
MYSQL:select的意外结果

如何解决《MYSQL:select的意外结果》经验，为你挑选了1个好方法。 ... [详细]
程序员
Docker容器集群

如何解决《Docker容器集群》经验，为你挑选了1个好方法。 ... [详细]
程序员
Chrome控制台清除分配和变量

如何解决《Chrome控制台清除分配和变量》经验，为你挑选了4个好方法。 ... [详细]
程序员
R - dplyr融合配对数据的交叉

如何解决《R-dplyr融合配对数据的交叉》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java仍在运行时重新创建日志文件

如何解决《Java仍在运行时重新创建日志文件》经验，为你挑选了0个好方法。 ... [详细]
程序员
收益率是否可以折返？

如何解决《收益率是否可以折返？》经验，为你挑选了0个好方法。 ... [详细]
程序员
MySQL - 从timestamp列选择每2小时的间隔

如何解决《MySQL-从timestamp列选择每2小时的间隔》经验，为你挑选了1个好方法。 ... [详细]
程序员
此子查询出错

如何解决《此子查询出错》经验，为你挑选了1个好方法。 ... [详细]
程序员
Visual Studio 2015不断切换启动项目

如何解决《VisualStudio2015不断切换启动项目》经验，为你挑选了3个好方法。 ... [详细]
程序员
使用Dapper自动映射输出参数

如何解决《使用Dapper自动映射输出参数》经验，为你挑选了0个好方法。 ... [详细]

135369一生真爱_890

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章