1赞

使用pyspark时如何在条件中使用for循环？

作者：放ch养奶牛 | 2023-09-06 12:33

如何解决《使用pyspark时如何在条件中使用for循环？》经验，为你挑选了1个好方法。

我正在尝试检查何时以及是否满足条件的多个列值0。我们的Spark数据框的列从1到11，需要检查其值。目前，我的代码如下：

df3 =df3.withColumn('Status', when((col("1") ==0)|(col("2") ==0)|(col("3") ==0)| (col("4") ==0) |(col("5") ==0)|(col("6") ==0)|(col("7") ==0)| (col("8") ==0)|(col("9") ==0)|(col("10") ==0)| (col("11") ==0) ,'Incomplete').otherwise('Complete'))

我如何仅通过使用for循环而不是那么多or条件来实现此目的

1> napoleon_bor..：

我提出了一个更pythonic的解决方案。使用functools.reduce和operator.or_。

import operator
import functools

colnames = [str(i+1) for i in range(11)]
df1 = spark._sc.parallelize([
  [it for it in range(11)], 
  [it for it in range(1,12)]]
).toDF((colnames))

df1.show()
+---+---+---+---+---+---+---+---+---+---+---+
|  1|  2|  3|  4|  5|  6|  7|  8|  9| 10| 11|
+---+---+---+---+---+---+---+---+---+---+---+
|  0|  1|  2|  3|  4|  5|  6|  7|  8|  9| 10|
|  1|  2|  3|  4|  5|  6|  7|  8|  9| 10| 11|
+---+---+---+---+---+---+---+---+---+---+---+

cond_expr = functools.reduce(operator.or_, [(f.col(c) == 0) for c in df1.columns])

df1.withColumn('test', f.when(cond_expr, f.lit('Incomplete')).otherwise('Complete')).show()
+---+---+---+---+---+---+---+---+---+---+---+----------+
|  1|  2|  3|  4|  5|  6|  7|  8|  9| 10| 11|      test|
+---+---+---+---+---+---+---+---+---+---+---+----------+
|  0|  1|  2|  3|  4|  5|  6|  7|  8|  9| 10|Incomplete|
|  1|  2|  3|  4|  5|  6|  7|  8|  9| 10| 11|  Complete|
+---+---+---+---+---+---+---+---+---+---+---+----------+

这样，您无需定义任何函数，评估字符串表达式或使用python lambdas。希望这可以帮助。

推荐阅读

程序员
如何通过Laravel IoC Container访问Orchestra Xml Parser

如何解决《如何通过LaravelIoCContainer访问OrchestraXmlParser》经验，为你挑选了1个好方法。 ... [详细]
程序员
Ionic - 如何将会话令牌存储为全局(对于app)可访问变量？

如何解决《Ionic-如何将会话令牌存储为全局(对于app)可访问变量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
ng-pattern允许单词之间的空格

如何解决《ng-pattern允许单词之间的空格》经验，为你挑选了2个好方法。 ... [详细]
程序员
PHP - 将数组返回为字符串

如何解决《PHP-将数组返回为字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
Sitecore项目访问权限

如何解决《Sitecore项目访问权限》经验，为你挑选了1个好方法。 ... [详细]
程序员
AdaptiveTrigger和DataTemplate

如何解决《AdaptiveTrigger和DataTemplate》经验，为你挑选了1个好方法。 ... [详细]
程序员
致命错误:codeigniter中超出了30秒的最大执行时间

如何解决《致命错误:codeigniter中超出了30秒的最大执行时间》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android设备监视器中未列出"适用于Android的Visual Studio模拟器"设备

如何解决《Android设备监视器中未列出"适用于Android的VisualStudio模拟器"设备》经验，为你挑选了3个好方法。 ... [详细]
程序员
angularjs绝对打造视觉工作室2015

如何解决《angularjs绝对打造视觉工作室2015》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在JQuery数据表中添加Rowspan

如何解决《如何在JQuery数据表中添加Rowspan》经验，为你挑选了1个好方法。 ... [详细]
程序员
Osmdroid在标记内插入文本

如何解决《Osmdroid在标记内插入文本》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用django进行CLI工具

如何解决《使用django进行CLI工具》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用GitHub Desktop一次丢弃所有更改

如何解决《使用GitHubDesktop一次丢弃所有更改》经验，为你挑选了1个好方法。 ... [详细]
程序员
离子应用程序中的计时器(setInterval)在后台运行一段时间后会进入睡眠状态

如何解决《离子应用程序中的计时器(setInterval)在后台运行一段时间后会进入睡眠状态》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么RegisterAllAreas中的区域顺序随Visual Studio 2015而变化？

如何解决《为什么RegisterAllAreas中的区域顺序随VisualStudio2015而变化？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用Querydsl和Spring Data时的最佳实践

如何解决《使用Querydsl和SpringData时的最佳实践》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在android中以编程方式检查哪个sim设置为默认sim

如何解决《如何在android中以编程方式检查哪个sim设置为默认sim》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在MongoDB v3.0.5中创建用户

如何解决《如何在MongoDBv3.0.5中创建用户》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在c中使用sscanf分隔整数值？

如何解决《如何在c中使用sscanf分隔整数值？》经验，为你挑选了1个好方法。 ... [详细]
程序员
首选项支持库 - SwitchPreference无法正常工作

如何解决《首选项支持库-SwitchPreference无法正常工作》经验，为你挑选了1个好方法。 ... [详细]

放ch养奶牛

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章