在Spark中为具有1500列的表定义DataFrame模式

作者：coco2冰冰 | 2023-09-06 17:23

如何解决《在Spark中为具有1500列的表定义DataFrame模式》经验，为你挑选了1个好方法。

我在SQL Server中有大约1500列的表。我需要从该表中读取数据，然后将其转换为正确的数据类型格式，然后将记录插入Oracle DB。

为表中包含1500多个列的这种类型的表定义架构的最佳方法是什么。除了对列名和数据类型进行硬编码之外，还有其他选择吗？

使用 Case class

使用StructType。

使用的Spark版本为1.4

1> Ram Ghadiyar..：

对于这种类型的要求。我会提供case类方法来准备数据框

是的，有一些局限性，例如生产率，但我们可以克服...您可以像<版本2.11的以下示例所示进行操作：

准备一个案例类extends Product并覆盖方法。

喜欢...

productArity():Int:这将返回属性的大小。在我们的例子中，它是33。因此，我们的实现如下所示：

productElement(n:Int):Any:给定一个索引，这将返回属性。作为保护，我们还有一个默认情况，该情况会引发IndexOutOfBoundsException异常：

canEqual (that:Any):Boolean：这是三个函数中的最后一个，当对类进行相等检查时，它作为边界条件：

您可以参考该学生案例类的示例实现，其中包含33个字段

此处示例学生数据集描述

另外一个选项：

使用StructType定义架构并创建数据框。（如果您不想使用spark csv api）

推荐阅读

程序员
PHP XDEBUG未启用

如何解决《PHPXDEBUG未启用》经验，为你挑选了1个好方法。 ... [详细]
程序员
Linq Lambda Where子句在where子句中

如何解决《LinqLambdaWhere子句在where子句中》经验，为你挑选了1个好方法。 ... [详细]
程序员
两个ImageView出现在Navigation标题中,而我只在xml中设置了一个

如何解决《两个ImageView出现在Navigation标题中,而我只在xml中设置了一个》经验，为你挑选了1个好方法。 ... [详细]
程序员
在ios的背景中连续显示"打开蓝牙以允许应用程序连接到附件"警报消息

如何解决《在ios的背景中连续显示"打开蓝牙以允许应用程序连接到附件"警报消息》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何检查javascript数组中是否存在密钥？

如何解决《如何检查javascript数组中是否存在密钥？》经验，为你挑选了2个好方法。 ... [详细]
程序员
按位AND和OR运算的说明

如何解决《按位AND和OR运算的说明》经验，为你挑选了1个好方法。 ... [详细]
程序员
max在一组列表上做了什么？

如何解决《max在一组列表上做了什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在R中的函数中保存单个对象：RData文件的大小非常大

如何解决《在R中的函数中保存单个对象：RData文件的大小非常大》经验，为你挑选了1个好方法。 ... [详细]
程序员
以4k(3840*2160)分辨率缩放Tkinter GUI？

如何解决《以4k(3840*2160)分辨率缩放TkinterGUI？》经验，为你挑选了1个好方法。 ... [详细]
程序员
基于已安装的引擎,使用url_for获取基于约束的url

如何解决《基于已安装的引擎,使用url_for获取基于约束的url》经验，为你挑选了1个好方法。 ... [详细]
程序员
当app强制退出时如何恢复下载？

如何解决《当app强制退出时如何恢复下载？》经验，为你挑选了0个好方法。 ... [详细]
程序员
改变Tx蓝牙Linux无效

如何解决《改变Tx蓝牙Linux无效》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Aurelia repeat.for中有条件地添加或删除CSS类？

如何解决《如何在Aureliarepeat.for中有条件地添加或删除CSS类？》经验，为你挑选了1个好方法。 ... [详细]
程序员
ForkJoinPool.invoke()和ForkJoinTask.invoke()或compute()

如何解决《ForkJoinPool.invoke()和ForkJoinTask.invoke()或compute()》经验，为你挑选了1个好方法。 ... [详细]
程序员
多个广告尺寸的Google广告会导致失败

如何解决《多个广告尺寸的Google广告会导致失败》经验，为你挑选了0个好方法。 ... [详细]
程序员
正则表达式(C#)对于RFC 4180的CSV

如何解决《正则表达式(C#)对于RFC4180的CSV》经验，为你挑选了0个好方法。 ... [详细]
程序员
IntelliJ - 查找未记录的公共方法

如何解决《IntelliJ-查找未记录的公共方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
与'wss:// ...'的WebSocket连接失败:连接建立错误:net :: ERR_CONNECTION_CLOSED

如何解决《与'wss://'的WebSocket连接失败:连接建立错误:net::ERR_CONNECTION_CLOSED》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么要将String转换为String？

如何解决《为什么要将String转换为String？》经验，为你挑选了1个好方法。 ... [详细]
程序员
c中的typedef枚举说明

如何解决《c中的typedef枚举说明》经验，为你挑选了2个好方法。 ... [详细]

coco2冰冰

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章

在Spark中为具有1500列的表定义DataFrame模式

另外一个选项 ：

另外一个选项：