11赞

有没有办法获取Spark Dataframe的前1000行？

作者：罗文彬2502852027 | 2023-09-10 15:55

如何解决《有没有办法获取SparkDataframe的前1000行？》经验，为你挑选了1个好方法。

我正在使用该randomSplit函数来获取少量的数据帧以用于开发目的,我最终只取这个函数返回的第一个df.

val df_subset = data.randomSplit(Array(0.00000001, 0.01), seed = 12345)(0)

如果我使用df.take(1000)那么我最终得到一个行数组 - 而不是数据帧,所以这对我不起作用.

有没有更好,更简单的方法来说出df的前1000行并将其存储为另一个df？

1> Markon..：

您正在寻找的方法是.limit.

取前n行返回一个新的数据集.此函数与head之间的区别在于head返回一个数组,而limit返回一个新的数据集.

只是为了记录,我使用.limit并返回数据集而不是DataFrame(这不是问题)

感谢更新。似乎Spark 2.X发生了很大变化:)

推荐阅读

程序员
Python不能在非持久属性上设置属性

如何解决《Python不能在非持久属性上设置属性》经验，为你挑选了1个好方法。 ... [详细]
程序员
返回值优化和析构函数调用

如何解决《返回值优化和析构函数调用》经验，为你挑选了1个好方法。 ... [详细]
程序员
打字稿和传播操作符？

如何解决《打字稿和传播操作符？》经验，为你挑选了2个好方法。 ... [详细]
程序员
`test:first job:script应该是一个字符串或一个字符串数组

如何解决《`test:firstjob:script应该是一个字符串或一个字符串数组》经验，为你挑选了0个好方法。 ... [详细]
程序员
适配器作为演示者？或者与演示者交谈？Android和MVP

如何解决《适配器作为演示者？或者与演示者交谈？Android和MVP》经验，为你挑选了0个好方法。 ... [详细]
程序员
OkHttp Post Body as JSON

如何解决《OkHttpPostBodyasJSON》经验，为你挑选了3个好方法。 ... [详细]
程序员
在任何情况下,您更喜欢比较低的时间复杂算法更高的大O时间复杂度算法吗？

如何解决《在任何情况下,您更喜欢比较低的时间复杂算法更高的大O时间复杂度算法吗？》经验，为你挑选了18个好方法。 ... [详细]
程序员
选择案例不按预期工作

如何解决《选择案例不按预期工作》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Jquery和Ajax从JSON文件检索数据？

如何解决《如何使用Jquery和Ajax从JSON文件检索数据？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用browserify和debowerify进行编译后,下划线中的"this"未定义

如何解决《使用browserify和debowerify进行编译后,下划线中的"this"未定义》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何从TFS 2013中删除Sharepoint和Reporting Services？

如何解决《如何从TFS2013中删除Sharepoint和ReportingServices？》经验，为你挑选了1个好方法。 ... [详细]
程序员
xcode 7.2无法构建Objective-C模块

如何解决《xcode7.2无法构建Objective-C模块》经验，为你挑选了1个好方法。 ... [详细]
程序员
Meteor,WebSocket,Nginx 502错误

如何解决《Meteor,WebSocket,Nginx502错误》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用继承重叠Spring bean名称

如何解决《使用继承重叠Springbean名称》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何强制Axis客户端使用TLSv1.2协议

如何解决《如何强制Axis客户端使用TLSv1.2协议》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用ggplot2的直方图中心条

如何解决《使用ggplot2的直方图中心条》经验，为你挑选了1个好方法。 ... [详细]
程序员
IncomingMessage中止事件

如何解决《IncomingMessage中止事件》经验，为你挑选了0个好方法。 ... [详细]
程序员
Openlayers 3 Offset RegularShape

如何解决《Openlayers3OffsetRegularShape》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何重现相同状态的基于随机的算法

如何解决《如何重现相同状态的基于随机的算法》经验，为你挑选了1个好方法。 ... [详细]
程序员
phpMyAdmin提供export.php而不是数据库sql转储

如何解决《phpMyAdmin提供export.php而不是数据库sql转储》经验，为你挑选了1个好方法。 ... [详细]

罗文彬2502852027

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章