使用spark dataFrame从HDFS加载数据

作者：无名有名我无名_593 | 2023-06-11 13:44

如何解决《使用sparkdataFrame从HDFS加载数据》经验，为你挑选了1个好方法。

我们可以在从HDFS读取数据时使用DataFrame.我在HDFS中有一个制表符分隔数据.

我用Google搜索,但看到它可以与NoSQL数据一起使用

1> Robin East..：

DataFrame当然不仅限于NoSQL数据源.Parquet,ORC和JSON支持本机提供1.4到1.6.1; 使用spark-cvs包支持文本分隔文件.

如果你的tsv文件在HDFS// demo/data中,那么下面的代码会将文件读入DataFrame

sqlContext.read.
  format("com.databricks.spark.csv").
  option("delimiter","\t").
  option("header","true").
  load("hdfs:///demo/data/tsvtest.tsv").show

要从spark-shell运行代码,请使用以下命令:

--packages com.databricks:spark-csv_2.10:1.4.0

在Spark 2.0中,本机支持csv,因此您应该可以执行以下操作:

spark.read.
  option("delimiter","\t").
  option("header","true").
  csv("hdfs:///demo/data/tsvtest.tsv").show

推荐阅读

程序员
将系统属性传递给spring boot

如何解决《将系统属性传递给springboot》经验，为你挑选了1个好方法。 ... [详细]
程序员
d3.js geo worldmap - 合并俄罗斯(从美国右边的左边小部分向左移位)

如何解决《d3.jsgeoworldmap-合并俄罗斯(从美国右边的左边小部分向左移位)》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在.cshtml中使用@：

如何解决《如何在.cshtml中使用@：》经验，为你挑选了1个好方法。 ... [详细]
程序员
Modelica质量/能量/动量平衡

如何解决《Modelica质量/能量/动量平衡》经验，为你挑选了1个好方法。 ... [详细]
程序员
NPM + Zurb Foundation + WebPack:无法解析模块'基础'

如何解决《NPM+ZurbFoundation+WebPack:无法解析模块'基础'》经验，为你挑选了4个好方法。 ... [详细]
程序员
使用推土机可以将多个字段映射到一个字段吗？

如何解决《使用推土机可以将多个字段映射到一个字段吗？》经验，为你挑选了0个好方法。 ... [详细]
程序员
(Android)尝试抛出OutOfMemoryError时抛出OutOfMemoryError

如何解决《(Android)尝试抛出OutOfMemoryError时抛出OutOfMemoryError》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用ng-repeat或ng-model填充textarea,以便它不会使用迭代数据创建一个新的textarea

如何解决《使用ng-repeat或ng-model填充textarea,以便它不会使用迭代数据创建一个新的textarea》经验，为你挑选了1个好方法。 ... [详细]
程序员
Fullcalendar:如何删除事件

如何解决《Fullcalendar:如何删除事件》经验，为你挑选了1个好方法。 ... [详细]
程序员
覆盖动画填充模式:在JavaScript/CSS中转发

如何解决《覆盖动画填充模式:在JavaScript/CSS中转发》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何获取byte []以在视图上显示为div的背景图像（C＃，ASP.NET，MVC）

如何解决《如何获取byte[]以在视图上显示为div的背景图像（C＃，ASP.NET，MVC）》经验，为你挑选了0个好方法。 ... [详细]
程序员
有没有办法确定C++编译器实现的语言功能？

如何解决《有没有办法确定C++编译器实现的语言功能？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Seaborn热图旁边添加列

如何解决《如何在Seaborn热图旁边添加列》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么TypeError上的JSON.stringify返回一个空对象

如何解决《为什么TypeError上的JSON.stringify返回一个空对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
角饼干

如何解决《角饼干》经验，为你挑选了3个好方法。 ... [详细]
程序员
从协议扩展实例方法中读取静态var

如何解决《从协议扩展实例方法中读取静态var》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么我使用框架获得不可用的声明

如何解决《为什么我使用框架获得不可用的声明》经验，为你挑选了1个好方法。 ... [详细]
程序员
将可变长度JSON数组解码为Rust数组

如何解决《将可变长度JSON数组解码为Rust数组》经验，为你挑选了1个好方法。 ... [详细]
程序员
git rebase是否会产生比git merge更多的冲突？

如何解决《gitrebase是否会产生比gitmerge更多的冲突？》经验，为你挑选了1个好方法。 ... [详细]
程序员
单击edittext时自动滚动

如何解决《单击edittext时自动滚动》经验，为你挑选了1个好方法。 ... [详细]

无名有名我无名_593

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章