18赞

SparkSession通过JDBC通过HiveServer2连接不返回任何内容

作者：雯颜哥_135 | 2023-09-07 00:46

如何解决《SparkSession通过JDBC通过HiveServer2连接不返回任何内容》经验，为你挑选了0个好方法。

我有一个关于在Apache Zeppelin中使用JDBC和SparkSession从远程HiveServer2读取数据的问题。

这是代码。

%spark

import org.apache.spark.sql.Row
import org.apache.spark.sql.SparkSession

val prop = new java.util.Properties
prop.setProperty("user","hive")
prop.setProperty("password","hive")
prop.setProperty("driver", "org.apache.hive.jdbc.HiveDriver")

val test = spark.read.jdbc("jdbc:hive2://xxx.xxx.xxx.xxx:10000/", "tests.hello_world", prop)

test.select("*").show()

当我运行它时，我没有错误，但是也没有数据，我只是检索表的所有列名，如下所示：

+--------------+
|hello_world.hw|
+--------------+
+--------------+

代替这个：

+--------------+
|hello_world.hw|
+--------------+
+ data_here    +
+--------------+

我正在所有这些上运行：Scala 2.11.8，OpenJDK 8，Zeppelin 0.7.0，Spark 2.1.0（bde / spark），Hive 2.1.1（bde / hive）

我在Docker中运行此安装程序，每个安装程序都有自己的容器，但连接在同一网络中。

此外，它仅在我使用Spark Beeeline连接到我的远程Hive时有效。

我忘了什么吗？任何帮助，将不胜感激。提前致谢。

编辑：

我找到了一种解决方法，即在Spark和Hive之间共享docker卷或docker数据容器，更确切地说是在两者之间共享Hive仓库文件夹，并配置spark-defaults.conf。然后，您可以在没有JDBC的情况下通过SparkSession访问配置单元。这是逐步的方法：

在Spark和Hive之间共享Hive仓库文件夹

像这样配置spark-defaults.conf：

spark.serializer     org.apache.spark.serializer.KryoSerializer

spark.driver.memory              Xg

spark.driver.cores       X

spark.executor.memory        Xg

spark.executor.cores         X

spark.sql.warehouse.dir         file:///your/path/here

将“ X”替换为您的值。

希望能帮助到你。

推荐阅读

程序员
Android自定义属性未显示

如何解决《Android自定义属性未显示》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在CakePHP 3中的model-> save()上获取SQL查询？

如何解决《如何在CakePHP3中的model->save()上获取SQL查询？》经验，为你挑选了0个好方法。 ... [详细]
程序员
允许管理员用户查看其他用户类型可以查看/执行的操作？

如何解决《允许管理员用户查看其他用户类型可以查看/执行的操作？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将对象列表保存到文本文件

如何解决《将对象列表保存到文本文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
GNU malloc_info():获得真正分配的内存？

如何解决《GNUmalloc_info():获得真正分配的内存？》经验，为你挑选了0个好方法。 ... [详细]
程序员
在正则表达式拆分期间发生javascript未定义元素

如何解决《在正则表达式拆分期间发生javascript未定义元素》经验，为你挑选了1个好方法。 ... [详细]
程序员
从数组中选择奇数或偶数元素

如何解决《从数组中选择奇数或偶数元素》经验，为你挑选了1个好方法。 ... [详细]
程序员
缺少Type.GetMember和MemberInfo.GetCustomAttributes（C＃PCL .NET 4.6）

如何解决《缺少Type.GetMember和MemberInfo.GetCustomAttributes（C＃PCL.NET4.6）》经验，为你挑选了1个好方法。 ... [详细]
程序员
转储Postgres DB，时间和.sql文件的权重

如何解决《转储PostgresDB，时间和.sql文件的权重》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何直接写入模仿scalar_summary的摘要？

如何解决《如何直接写入模仿scalar_summary的摘要？》经验，为你挑选了2个好方法。 ... [详细]
程序员
更改左侧的ToolBar默认图标

如何解决《更改左侧的ToolBar默认图标》经验，为你挑选了1个好方法。 ... [详细]
程序员
BufferedWriter类的writeLine方法

如何解决《BufferedWriter类的writeLine方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
部分索引的局限性是什么？

如何解决《部分索引的局限性是什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
我怎样才能简单地添加一个Spring Data REST实体的链接

如何解决《我怎样才能简单地添加一个SpringDataREST实体的链接》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么这个函数返回NaN？

如何解决《为什么这个函数返回NaN？》经验，为你挑选了0个好方法。 ... [详细]
程序员
由于约束错误,无法在C#中实现VB接口

如何解决《由于约束错误,无法在C#中实现VB接口》经验，为你挑选了1个好方法。 ... [详细]
程序员
从SPARK中的另一个RDD返回最大N值的RDD

如何解决《从SPARK中的另一个RDD返回最大N值的RDD》经验，为你挑选了1个好方法。 ... [详细]
程序员
Try-catch创建无限循环

如何解决《Try-catch创建无限循环》经验，为你挑选了1个好方法。 ... [详细]
程序员
E_UNEXPECTED UWP灾难性失败

如何解决《E_UNEXPECTEDUWP灾难性失败》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何识别向量中一系列NA的索引

如何解决《如何识别向量中一系列NA的索引》经验，为你挑选了1个好方法。 ... [详细]

雯颜哥_135

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章