16赞

使用Spark列出Hadoop HDFS目录中的所有文件？

作者：乐韵答题 | 2023-06-12 10:14

如何解决《使用Spark列出HadoopHDFS目录中的所有文件？》经验，为你挑选了1个好方法。

我想循环遍历Hadoop目录中的所有文本文件,并计算单词"error"的所有出现次数.有没有办法hadoop fs -ls /users/ubuntu/用Apache Spark Scala API列出目录中的所有文件？

从给定的第一个示例中,spark上下文似乎只能通过以下方式单独访问文件:

val file = spark.textFile("hdfs://target_load_file.txt")

在我的问题中,我不知道预先在HDFS文件夹中有多少文件名.看了一下spark上下文文档,却找不到这种功能.

1> Daniel Darab..：

您可以使用通配符:

val errorCount = sc.textFile("hdfs://some-directory/*")
                   .flatMap(_.split(" ")).filter(_ == "error").count

使用`sc.wholeTextFiles`.对于这个问题,请参见http://stackoverflow.com/questions/29521665/how-to-map-filenames-to-rdd-using-sc-textfiles3n-bucket-csv.

推荐阅读

程序员
node js callback()函数没有定义？

如何解决《nodejscallback()函数没有定义？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Postgresql序列与串行

如何解决《Postgresql序列与串行》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何为PHP CLI启用颜色？

如何解决《如何为PHPCLI启用颜色？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Javascript Regexp测试方法奇怪的行为

如何解决《JavascriptRegexp测试方法奇怪的行为》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在Sails JS中从exists数据库生成模型？

如何解决《如何在SailsJS中从exists数据库生成模型？》经验，为你挑选了0个好方法。 ... [详细]
程序员
传递jquery变量

如何解决《传递jquery变量》经验，为你挑选了0个好方法。 ... [详细]
程序员
sizeof(vector)的大小是多少？C++

如何解决《sizeof(vector)的大小是多少？C++》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android嵌套ViewPager禁用触摸事件

如何解决《Android嵌套ViewPager禁用触摸事件》经验，为你挑选了1个好方法。 ... [详细]
程序员
设备令牌获得Nil

如何解决《设备令牌获得Nil》经验，为你挑选了0个好方法。 ... [详细]
程序员
更有效的方法来编写这个算法？

如何解决《更有效的方法来编写这个算法？》经验，为你挑选了3个好方法。 ... [详细]
程序员
Java toString()没有打印正确的变量

如何解决《JavatoString()没有打印正确的变量》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么这个循环被认为是数据竞争[Golang]

如何解决《为什么这个循环被认为是数据竞争[Golang]》经验，为你挑选了1个好方法。 ... [详细]
程序员
我试图创建新的JDBC资源时,在glassfish中类java.lang.RuntimeException

如何解决《我试图创建新的JDBC资源时,在glassfish中类java.lang.RuntimeException》经验，为你挑选了1个好方法。 ... [详细]
程序员
从逗号分隔的字符串中获取特定值

如何解决《从逗号分隔的字符串中获取特定值》经验，为你挑选了1个好方法。 ... [详细]
程序员
在C中反转字符串的最快方法

如何解决《在C中反转字符串的最快方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
谷歌图片搜索说api不再可用

如何解决《谷歌图片搜索说api不再可用》经验，为你挑选了3个好方法。 ... [详细]
程序员
在Django 1.8中创建基于登录和注销类的视图

如何解决《在Django1.8中创建基于登录和注销类的视图》经验，为你挑选了1个好方法。 ... [详细]
程序员
指向函数成员的指针:`R(*C ::*)(Args ...)`是什么意思？

如何解决《指向函数成员的指针:`R(*C::*)(Args)`是什么意思？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android中的视频编辑API

如何解决《Android中的视频编辑API》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从源本地构建和安装Puppet模块？

如何解决《如何从源本地构建和安装Puppet模块？》经验，为你挑选了1个好方法。 ... [详细]

乐韵答题

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章