当前位置:  开发笔记 > 前端 > 正文

如何使用Apache Spark将JSON文件转换为镶木地板?

如何解决《如何使用ApacheSpark将JSON文件转换为镶木地板?》经验,为你挑选了1个好方法。

我是Apache Spark 1.3.1的新手.如何将JSON文件转换为Parquet?



1> Rami..:

Spark 1.4及更高版本

您可以使用sparkSQL首先将JSON文件读入DataFrame,然后将DataFrame写为镶木地板文件.

val df = sqlContext.read.json("path/to/json/file")
df.write.parquet("path/to/parquet/file")

要么

df.save("path/to/parquet/file", "parquet")

点击此处和此处查看示例和更多详细信息.

Spark 1.3.1

val df = sqlContext.jsonFile("path/to/json/file")
df.saveAsParquetFile("path/to/parquet/file")

与Windows和Spark 1.3.1相关的问题

保存数据帧作为Windows拼花文件将抛出java.lang.NullPointerException,如所描述这里.

在这种情况下,请考虑升级到更新的Spark版本.

推荐阅读
周扒pi
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有