3赞

如何将函数应用于Spark DataFrame的列？

作者：php | 2023-09-08 13:32

如何解决《如何将函数应用于SparkDataFrame的列？》经验，为你挑选了1个好方法。

我们假设我们有一个Spark DataFrame

df.getClass
Class[_ <: org.apache.spark.sql.DataFrame] = class org.apache.spark.sql.DataFrame

使用以下架构

df.printSchema
root
|-- rawFV: string (nullable = true)
|-- tk: array (nullable = true)
|    |-- element: string (containsNull = true)

鉴于列的每一行tk都是一个字符串数组,如何编写一个Scala函数来返回每行中的元素数量？

1> zero323..：

您不必编写自定义函数,因为有一个:

import org.apache.spark.sql.functions.size

df.select(size($"tk"))

如果你真的想要你可以写一个udf:

import org.apache.spark.sql.functions.udf

val size_ = udf((xs: Seq[String]) => xs.size)

甚至创建自定义表达式,但实际上没有意义.

推荐阅读

程序员
准备加载内核

如何解决《准备加载内核》经验，为你挑选了0个好方法。 ... [详细]
程序员
从S3上的静态站点进行POST时,AWS API Gateway端点会出现CORS错误

如何解决《从S3上的静态站点进行POST时,AWSAPIGateway端点会出现CORS错误》经验，为你挑选了2个好方法。 ... [详细]
程序员
在Python中合并两个GEOJSON多边形

如何解决《在Python中合并两个GEOJSON多边形》经验，为你挑选了2个好方法。 ... [详细]
程序员
在chrome扩展中更改代码后,gulp刷新活动选项卡

如何解决《在chrome扩展中更改代码后,gulp刷新活动选项卡》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何聚合(最小/最大等)Django JSONField数据？

如何解决《如何聚合(最小/最大等)DjangoJSONField数据？》经验，为你挑选了3个好方法。 ... [详细]
程序员
ajax错误导致成功函数调用

如何解决《ajax错误导致成功函数调用》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何查询Firebase以获取equalTo布尔参数？

如何解决《如何查询Firebase以获取equalTo布尔参数？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Numpy中的Blockwise操作

如何解决《Numpy中的Blockwise操作》经验，为你挑选了1个好方法。 ... [详细]
程序员
g_main_loop_run阻止Qthread并且不允许停止视频

如何解决《g_main_loop_run阻止Qthread并且不允许停止视频》经验，为你挑选了0个好方法。 ... [详细]
程序员
Elixir是否支持内省以显示功能来源？

如何解决《Elixir是否支持内省以显示功能来源？》经验，为你挑选了1个好方法。 ... [详细]
程序员
从ResultSet Java获取价值

如何解决《从ResultSetJava获取价值》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在VS 2015/.NET 4.6中添加引用？

如何解决《如何在VS2015/.NET4.6中添加引用？》经验，为你挑选了0个好方法。 ... [详细]
程序员
从函数指针列表中获取函数的索引

如何解决《从函数指针列表中获取函数的索引》经验，为你挑选了1个好方法。 ... [详细]
程序员
由于物理设备上的XCApplicationStateRunningActive,Xcode UI测试失败

如何解决《由于物理设备上的XCApplicationStateRunningActive,XcodeUI测试失败》经验，为你挑选了0个好方法。 ... [详细]
程序员
尝试使用Spring MVC和Thymeleaf进行React/Ajax调用

如何解决《尝试使用SpringMVC和Thymeleaf进行React/Ajax调用》经验，为你挑选了1个好方法。 ... [详细]
程序员
正确实现异步Android SQLite数据库

如何解决《正确实现异步AndroidSQLite数据库》经验，为你挑选了1个好方法。 ... [详细]
程序员
我无法删除我的VPC

如何解决《我无法删除我的VPC》经验，为你挑选了2个好方法。 ... [详细]
程序员
Laravel API最佳实践

如何解决《LaravelAPI最佳实践》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java List <Map <String,Long >>映射键的组合之和

如何解决《JavaList<Map<String,Long>>映射键的组合之和》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用API 19+以较短的间隔更新Widget

如何解决《使用API19+以较短的间隔更新Widget》经验，为你挑选了0个好方法。 ... [详细]

php

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章