如何将500GB的SQL表转换为Apache Parquet？

作者：手机用户2402851335 | 2023-06-11 07:46

如何解决《如何将500GB的SQL表转换为ApacheParquet？》经验，为你挑选了1个好方法。

也许这有很好的文档,但我很困惑如何做到这一点(有很多Apache工具).

当我创建一个SQL表时,我使用以下命令创建表:

CREATE TABLE table_name(
   column1 datatype,
   column2 datatype,
   column3 datatype,
   .....
   columnN datatype,
   PRIMARY KEY( one or more columns )
);

如何将这个存在的表转换成Parquet？这个文件写入磁盘？如果原始数据是几GB,那么必须等待多长时间？

我可以将原始原始数据格式化为Parquet格式吗？

1> 小智..：

Apache Spark可用于执行此操作:

1.load your table from mysql via jdbc
2.save it as a parquet file

例:

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
df = spark.read.jdbc("YOUR_MYSQL_JDBC_CONN_STRING",  "YOUR_TABLE",properties={"user": "YOUR_USER", "password": "YOUR_PASSWORD"})
df.write.parquet("YOUR_HDFS_FILE")

推荐阅读

程序员
如何使用Mockito模拟Context？

如何解决《如何使用Mockito模拟Context？》经验，为你挑选了3个好方法。 ... [详细]
程序员
如何限制方法仅接受对象作为参数而不是类对象作为类型文字？

如何解决《如何限制方法仅接受对象作为参数而不是类对象作为类型文字？》经验，为你挑选了0个好方法。 ... [详细]
程序员
类别中的NSManagedObject子类属性

如何解决《类别中的NSManagedObject子类属性》经验，为你挑选了1个好方法。 ... [详细]
程序员
javax.el.ELException:无法将类型为java.lang.String的2015-12-03 18:50转换为类java.util.Date？

如何解决《javax.el.ELException:无法将类型为java.lang.String的2015-12-0318:50转换为类java.util.Date？》经验，为你挑选了1个好方法。 ... [详细]
程序员
我应该如何在Akka持久性中构造持久性参与者？

如何解决《我应该如何在Akka持久性中构造持久性参与者？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何获取uinput创建的设备的名称(路径)

如何解决《如何获取uinput创建的设备的名称(路径)》经验，为你挑选了1个好方法。 ... [详细]
程序员
getline()带有文件描述符而不是文件指针

如何解决《getline()带有文件描述符而不是文件指针》经验，为你挑选了1个好方法。 ... [详细]
程序员
在OpenCV中逐像素复制图像

如何解决《在OpenCV中逐像素复制图像》经验，为你挑选了1个好方法。 ... [详细]
程序员
告诉Volley不要使用缓存数据,而是发起新请求？

如何解决《告诉Volley不要使用缓存数据,而是发起新请求？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何检查符号链接是否存在,无论它指向何处

如何解决《如何检查符号链接是否存在,无论它指向何处》经验，为你挑选了1个好方法。 ... [详细]
程序员
从文件中删除一行

如何解决《从文件中删除一行》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android上是否有任何类型的粒子发射器,如iOS CAEmitterLayer用于圆形发射器？

如何解决《Android上是否有任何类型的粒子发射器,如iOSCAEmitterLayer用于圆形发射器？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在ASP.NET MVC 5中使用带有razor语法的jquery？

如何解决《如何在ASP.NETMVC5中使用带有razor语法的jquery？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用runhaskell取消隐藏ghc库

如何解决《如何使用runhaskell取消隐藏ghc库》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以在rmarkdown呈现的pdf文档中包含svg图像？

如何解决《是否可以在rmarkdown呈现的pdf文档中包含svg图像？》经验，为你挑选了0个好方法。 ... [详细]
程序员
无法建立搅拌机

如何解决《无法建立搅拌机》经验，为你挑选了0个好方法。 ... [详细]
程序员
在django-import-export中导入m2m关系

如何解决《在django-import-export中导入m2m关系》经验，为你挑选了1个好方法。 ... [详细]
程序员
Lodash过滤器和功能组合

如何解决《Lodash过滤器和功能组合》经验，为你挑选了1个好方法。 ... [详细]
程序员
在宏变量名称SAS中解析包含%eval的宏

如何解决《在宏变量名称SAS中解析包含%eval的宏》经验，为你挑选了1个好方法。 ... [详细]
程序员
C++模板专业化和继承

如何解决《C++模板专业化和继承》经验，为你挑选了1个好方法。 ... [详细]

手机用户2402851335

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章