17赞

我如何在PySpark的DataFrame中按顺序排序？

作者：可爱的天使keven_464 | 2023-09-09 16:08

如何解决《我如何在PySpark的DataFrame中按顺序排序？》经验，为你挑选了1个好方法。

类似于:

order_items.groupBy("order_item_order_id").count().orderBy(desc("count")).show()

我试过了:

order_items.groupBy("order_item_order_id").sum("order_item_subtotal").orderBy(desc("sum")).show()

但这会给出一个错误:

Py4JJavaError:调用o501.sort时发生错误.:org.apache.spark.sql.AnalysisException:无法解析'sum'给定的输入列order_item_order_id,SUM(order_item_subtotal#429);

我也尝试过:

order_items.groupBy("order_item_order_id").sum("order_item_subtotal").orderBy(desc("SUM(order_item_subtotal)")).show()

但我得到同样的错误:

Py4JJavaError:调用o512.sort时发生错误.:org.apache.spark.sql.AnalysisException:无法解析'SUM(order_item_subtotal)'给定输入列order_item_order_id,SUM(order_item_subtotal#429);

执行时我得到了正确的结果:

order_items.groupBy("order_item_order_id").sum("order_item_subtotal").orderBy(desc("SUM(order_item_subtotal#429)")).show()

但是,在看到Spark附加到总和列名称的数字,即#429之后,这是后验的.

有没有办法获得相同的结果,但先验,不知道将附加哪个数字？

1> architectoni..：

您应该为列使用别名:

import pyspark.sql.functions as func

order_items.groupBy("order_item_order_id")\
           .agg(func.sum("order_item_subtotal")\
                .alias("sum_column_name"))\
           .orderBy("sum_column_name")

推荐阅读

程序员
如何随机洗牌具有比PRNG时期更多排列的列表？

如何解决《如何随机洗牌具有比PRNG时期更多排列的列表？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何创建"逐步匹配"的正则表达式？

如何解决《如何创建"逐步匹配"的正则表达式？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Aurelia aurelia-fetch-client和JSON POST

如何解决《Aureliaaurelia-fetch-client和JSONPOST》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在C#中的json中反序列化表情符号

如何解决《如何在C#中的json中反序列化表情符号》经验，为你挑选了1个好方法。 ... [详细]
程序员
用于Cordova的Azure移动服务/ VS工具 - 404

如何解决《用于Cordova的Azure移动服务/VS工具-404》经验，为你挑选了0个好方法。 ... [详细]
程序员
从列表中调用元素的析构函数

如何解决《从列表中调用元素的析构函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
GetWindowRect返回包含"不可见"边框的大小

如何解决《GetWindowRect返回包含"不可见"边框的大小》经验，为你挑选了1个好方法。 ... [详细]
程序员
给定一个数组,找到小于c的n个数字的组合

如何解决《给定一个数组,找到小于c的n个数字的组合》经验，为你挑选了0个好方法。 ... [详细]
程序员
我如何找到谷歌bigquery数据集大小,而不是表大小

如何解决《我如何找到谷歌bigquery数据集大小,而不是表大小》经验，为你挑选了1个好方法。 ... [详细]
程序员
基于Python中的键的多个词典中的平均值？

如何解决《基于Python中的键的多个词典中的平均值？》经验，为你挑选了1个好方法。 ... [详细]
程序员
ggplot和png的rmarkdown错误

如何解决《ggplot和png的rmarkdown错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
将远程转储还原到RDS

如何解决《将远程转储还原到RDS》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何限制nohup.out日志的大小

如何解决《如何限制nohup.out日志的大小》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何检查Eigen :: Matrix4f是否接近单位矩阵？

如何解决《如何检查Eigen::Matrix4f是否接近单位矩阵？》经验，为你挑选了1个好方法。 ... [详细]
程序员
React Native,TouchableOpacity包装浮动按钮什么都没得到

如何解决《ReactNative,TouchableOpacity包装浮动按钮什么都没得到》经验，为你挑选了1个好方法。 ... [详细]
程序员
C中头文件中的内联函数

如何解决《C中头文件中的内联函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
反序列化非标准字符串

如何解决《反序列化非标准字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
脚本返回"已杀"

如何解决《脚本返回"已杀"》经验，为你挑选了1个好方法。 ... [详细]
程序员
将非必需的字符串属性从null水合为空字符串

如何解决《将非必需的字符串属性从null水合为空字符串》经验，为你挑选了0个好方法。 ... [详细]
程序员
加载模板dom时,angular2模板/钩子中的脚本标记

如何解决《加载模板dom时,angular2模板/钩子中的脚本标记》经验，为你挑选了2个好方法。 ... [详细]

可爱的天使keven_464

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章