我们可以直接将Parquet文件加载到Hive吗？

作者：家具销售_903 | 2023-09-10 09:20

如何解决《我们可以直接将Parquet文件加载到Hive吗？》经验，为你挑选了2个好方法。

我知道我们可以使用Spark SQL加载镶木地板文件并使用Impala但是想知道我们是否可以使用Hive做同样的事情.我一直在阅读很多文章,但我仍然感到困惑.

简单地说,我有一个镶木地板文件 - 比如users.parquet.现在我对如何从users.parquet加载/插入/导入数据到hive(显然是在表中)感到震惊.

如果我遗漏了明显的东西,请告诉或指出我正确的方向.

使用镶木地板文件元数据创建配置表

https://phdata.io/examples-using-textfile-and-parquet-with-hive-and-impala/

1> 小智..：

使用镶木地板工具获取镶木地板文件的架构,详情请查看链接http://kitesdk.org/docs/0.17.1/labs/4-using-parquet-tools-solution.html

并使用文件顶部的架构构建表,有关详细信息,请查看Create Hive表以从parquet/avro架构中读取镶木地板文件

2> Hendrik F..：

获取模式至关重要,因为您必须先在Hive中创建具有相应模式的表,然后将其指向镶木地板文件.

我有一个类似的问题,我在一个虚拟机中有数据,不得不将其移动到另一个虚拟机.这是我的演练:

了解有关原装镶文件(位置和架构): describe formatted users;与show create table users;后者将让你的模式的时候了,也指向你HDFS的位置hdfs://hostname:port/apps/hive/warehouse/users

了解有关表格分区的信息 show partitions users;

将表的Parquet文件从HDFS复制到本地目录

hdfs dfs -copyToLocal /apps/hive/warehouse/users

将它们移动到另一个群集/ VM或您希望它们到达的位置

CREATE USERS ...使用相同的架构在目标上创建users表

CREATE TABLE users ( name string, ... )
PARTITIONED BY (...)
STORED AS PARQUET;

现在,将Parquet文件移动到相应的文件夹中(如果需要,请查看您刚刚创建的表的位置)

hdfs dfs -ls /apps/hive/warehouse/users/
hdfs dfs -copyFromLocal ../temp/* /apps/hive/warehouse/

对于每个分区,您必须将Hive指向相应的子目录:( alter table users add partition (sign_up_date='19991231') location '/apps/hive/warehouse/users/sign_up_date=19991231';您可能希望使用bash脚本执行此操作)

这对我有用,希望它有所帮助.

推荐阅读

程序员
双轮廓和二次误差函数

如何解决《双轮廓和二次误差函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
for循环查找unix中是否存在目录

如何解决《for循环查找unix中是否存在目录》经验，为你挑选了1个好方法。 ... [详细]
程序员
sbt clear screen命令

如何解决《sbtclearscreen命令》经验，为你挑选了2个好方法。 ... [详细]
程序员
将数组中的每个元素乘以C中的数字

如何解决《将数组中的每个元素乘以C中的数字》经验，为你挑选了2个好方法。 ... [详细]
程序员
反思:如何正确调用没有参数的方法？

如何解决《反思:如何正确调用没有参数的方法？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么我从两个几乎相同的表达式获得不同的结果,以使用Entity Framework上下文从数据库获取数据

如何解决《为什么我从两个几乎相同的表达式获得不同的结果,以使用EntityFramework上下文从数据库获取数据》经验，为你挑选了2个好方法。 ... [详细]
程序员
Apache Lucene与Google Search Appliance

如何解决《ApacheLucene与GoogleSearchAppliance》经验，为你挑选了1个好方法。 ... [详细]
程序员
执行KornShell脚本

如何解决《执行KornShell脚本》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在intellij中调试播放框架2.1.0 scala测试

如何解决《如何在intellij中调试播放框架2.1.0scala测试》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在PHP中删除花括号

如何解决《如何在PHP中删除花括号》经验，为你挑选了1个好方法。 ... [详细]
程序员
libjpeg:复制整个数据

如何解决《libjpeg:复制整个数据》经验，为你挑选了1个好方法。 ... [详细]
程序员
自动保存和加载历史记录

如何解决《自动保存和加载历史记录》经验，为你挑选了1个好方法。 ... [详细]
程序员
Jasmine单元测试:$ compile从ng-repeat中产生注释

如何解决《Jasmine单元测试:$compile从ng-repeat中产生注释》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在aspx文件中调用转发器中的函数？

如何解决《如何在aspx文件中调用转发器中的函数？》经验，为你挑选了1个好方法。 ... [详细]
程序员
SQL Server 2012窗口函数计算运行总计

如何解决《SQLServer2012窗口函数计算运行总计》经验，为你挑选了1个好方法。 ... [详细]
程序员
JSHint:如何禁用检查注释的不安全字符？

如何解决《JSHint:如何禁用检查注释的不安全字符？》经验，为你挑选了2个好方法。 ... [详细]
程序员
YouTube API v3 apiclient.errors.HttpError“未选择过滤器。” -在哪里选择过滤器？

如何解决《YouTubeAPIv3apiclient.errors.HttpError“未选择过滤器。”-在哪里选择过滤器？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Sublime Text 2中的"智能引号"与LaTeXTools

如何解决《SublimeText2中的"智能引号"与LaTeXTools》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何让QtCreator在例外情况下中断？

如何解决《如何让QtCreator在例外情况下中断？》经验，为你挑选了1个好方法。 ... [详细]
程序员
MySQL导入数据库但忽略特定的表

如何解决《MySQL导入数据库但忽略特定的表》经验，为你挑选了2个好方法。 ... [详细]

家具销售_903

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章