当前位置:  开发笔记 > 编程语言 > 正文

从远程HDFS检索文件

如何解决《从远程HDFS检索文件》经验,为你挑选了1个好方法。

我的本地计算机没有安装hdfs.我想从远程hdfs集群中检索文件.实现这一目标的最佳方法是什么?我需要get从hdfs到其中一个集群机器fs的文件,然后使用ssh来检索它们吗?我希望能够通过说bash脚本以编程方式执行此操作.



1> Durga Viswan..:

以下是步骤:

确保主机与目标群集之间存在连接

将主机配置为客户端,需要安装兼容的hadoop二进制文件.您的主机也需要使用相同的操作系统运行.

确保您具有相同的配置文件(core-site.xml,hdfs-site.xml)

您可以运行hadoop fs -get命令直接获取文件

还有其他选择

如果配置了Webhdfs/httpFS,您实际上可以使用curl甚至浏览器下载文件.如果配置了Webhdfs,您可以编写bash scritps.

如果您的主机无法将Hadoop二进制文件安装为客户端,则可以使用以下说明.

启用密码减少从主机登录到群集上的节点之一

运行命令 ssh @ "hadoop fs -get "

然后用scp命令复制文件

您可以在一个脚本中包含上述2个命令

推荐阅读
雯颜哥_135
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有