我正在尝试在Ubuntu上安装Hadoop的单节点设置.我开始按照Hadoop 2.3文档中的说明进行操作.
但我似乎错过了一些非常简单的事情.
首先,它说
要获得Hadoop发行版,请从其中一个Apache下载镜像下载最新的稳定版本.
然后,
解压缩下载的Hadoop发行版.在分发中,编辑文件conf/hadoop-env.sh以至少将JAVA_HOME定义为Java安装的根目录.
但是,我似乎无法找到该conf
目录.
我在其中一个镜像下载了2.3版本.然后解压缩tarball,ls
内部返回:
$ ls bin etc include lib libexec LICENSE.txt NOTICE.txt README.txt sbin share
我能够找到他们引用的文件,而不是在conf
目录中:
$ find . -name hadoop-env.sh ./etc/hadoop/hadoop-env.sh
我错过了什么,还是我抓错了包裹?或者文档是否过时了?
如果是这样,任何人都知道哪些更新的文档是什么?
我正在尝试安装一个伪分布式模式Hadoop,遇到同样的问题.
通过阅读Hadoop The Definitive Guide(第三版)一书,第618页,它说:
In Hadoop 2.0 and later, MapReduce runs on YARN and there is an additional con- figuration file called yarn-site.xml. All the configuration files should go in the etc/hadoop subdirectory
希望这证实这etc/hadoop
是正确的地方.
我认为文档需要更新.虽然目录结构已更改,但重要文件(如hadoop-env.sh,core-ste.xml和hdfs-site.xml)的文件名未更改.您可能会发现以下链接对入门很有用.
http://codesfusion.blogspot.com/2013/10/setup-hadoop-2x-220-on-ubuntu.html
在Hadoop1中,
{$HADOOP_HOME}/conf/
在Hadoop2中,
{$HADOOP_HOME}/etc/hadoop