11赞

Spark如何读取文件并在文件名的开头加下划线？

作者：贾志军 | 2023-09-07 17:46

如何解决《Spark如何读取文件并在文件名的开头加下划线？》经验，为你挑选了1个好方法。

当我使用Spark来解析日志文件时,我注意到如果filename的第一个字符是_,则结果将为空.这是我的测试代码:

SparkSession spark = SparkSession
  .builder()
  .appName("TestLog")
  .master("local")
  .getOrCreate();
JavaRDD input = spark.read().text("D:\\_event_2.log").javaRDD();
System.out.println("size : " + input.count());

如果我将文件名修改为event_2.log,代码将正确运行它.我发现该text函数定义为:

@scala.annotation.varargs
def text(paths: String*): Dataset[String] = {
  format("text").load(paths : _*).as[String](sparkSession.implicits.newStringEncoder)
}

我认为这可能是因为_斯卡拉placeholder.我该如何避免这个问题？

1> Kien Truong..：

这与Scala无关.Spark使用Hadoop Input API来读取文件,该文件忽略以下划线(_)或点(.)开头的每个文件

我不知道如何在Spark中禁用它.

推荐阅读

程序员
如何将TypeScript WebPack ts-loader与Angular2 @View样式集成？

如何解决《如何将TypeScriptWebPackts-loader与Angular2@View样式集成？》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么基于排名的推荐使用NDCG？

如何解决《为什么基于排名的推荐使用NDCG？》经验，为你挑选了0个好方法。 ... [详细]
程序员
点按时,Universal Links不会将用户重定向到我的应用

如何解决《点按时,UniversalLinks不会将用户重定向到我的应用》经验，为你挑选了1个好方法。 ... [详细]
程序员
将功能参数识别为输入或输出

如何解决《将功能参数识别为输入或输出》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何为QTableWidget创建过滤器？

如何解决《如何为QTableWidget创建过滤器？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何正确导入Wand到python？

如何解决《如何正确导入Wand到python？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在ViewController中为UIButton创建事件？

如何解决《如何在ViewController中为UIButton创建事件？》经验，为你挑选了1个好方法。 ... [详细]
程序员
webpack umd lib和外部文件

如何解决《webpackumdlib和外部文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
PHP:重新加载时重置会话生存期

如何解决《PHP:重新加载时重置会话生存期》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否有可能在另一个请求中有一个Angular js $ http请求？

如何解决《是否有可能在另一个请求中有一个Angularjs$http请求？》经验，为你挑选了1个好方法。 ... [详细]
程序员
C#任务未完成(命令提示符中没有结果)

如何解决《C#任务未完成(命令提示符中没有结果)》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android数据绑定后备/默认值

如何解决《Android数据绑定后备/默认值》经验，为你挑选了2个好方法。 ... [详细]
程序员
Visual Studio 2015挂起然后:'XamarinIOSPackage'包未正确加载

如何解决《VisualStudio2015挂起然后:'XamarinIOSPackage'包未正确加载》经验，为你挑选了1个好方法。 ... [详细]
程序员
位置固定100父母

如何解决《位置固定100父母》经验，为你挑选了2个好方法。 ... [详细]
程序员
新ASP.NET MVC 6标识中AspNetUsers表中ConcurrencyStamp列的用途是什么？

如何解决《新ASP.NETMVC6标识中AspNetUsers表中ConcurrencyStamp列的用途是什么？》经验，为你挑选了3个好方法。 ... [详细]
程序员
Array.create和锯齿状数组

如何解决《Array.create和锯齿状数组》经验，为你挑选了1个好方法。 ... [详细]
程序员
多态，参数多态，临时多态

如何解决《多态，参数多态，临时多态》经验，为你挑选了1个好方法。 ... [详细]
程序员
不能使用Asp MVC 6 Web Api的HttpClient

如何解决《不能使用AspMVC6WebApi的HttpClient》经验，为你挑选了1个好方法。 ... [详细]
程序员
Handlebarsjs检查字符串是否等于值

如何解决《Handlebarsjs检查字符串是否等于值》经验，为你挑选了2个好方法。 ... [详细]
程序员
ES2015在相同范围内两次构造对象

如何解决《ES2015在相同范围内两次构造对象》经验，为你挑选了1个好方法。 ... [详细]

贾志军

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章