4赞

如何在Win10系统使用Python3连接Hive

作者：mobiledu2402852413 | 2021-11-03 00:43

由于数据存放在大数据平台的Hive数据仓库中，我需要在Win10系统上利用Python3连接Hive，然后读取数据，进行探索、分析和挖掘工作。我通过网上查找资料和实际测试，把Win10系统Python3成功连接Hive配置总结如下。第一步：安装依赖库pipinstallbitarraypipinst

由于数据存放在大数据平台的Hive数据仓库中，我需要在Win10系统上利用Python3连接Hive，然后读取数据，进行探索、分析和挖掘工作。

我通过网上查找资料和实际测试，把Win10系统Python3成功连接Hive配置总结如下。

第一步：安装依赖库

pip install bitarray
pip install bit_array
pip install thrift
pip install thriftpy
pip install pure_sasl
pip install --no-deps thrift-sasl==0.2.1

提示：若是无法安装，也可以点击如下网址，

https://www.lfd.uci.edu/~gohlke/pythonlibs/

选择合适库的whl下载，然后进行本地化安装。

第二步：安装impyla库

我采用本地化安装方式，先下载impyla库的whl，如下图：

再安装

pip install E:/Python_Library/impyla-0.16.2-py2.py3-none-any.whl

提示：上面的绝对路径根据你自己的情况而定

第三步：测试impyla库是否可以使用

from impala.dbapi import connect #用来连接Hive的函数
from impala.util import as_pandas #用来把数据结构转换为pandas

若是运行通过，表示利用impala连接Hive配置成功。

简单示例：

从Hive的一张表读取100条记录，放到pandas的DataFrame里面。

参考代码：

from impala.dbapi import connect #用来连接Hive的函数
from impala.util import as_pandas #用来把数据结构转换为pandas

conn = connect(host='my.host.com', port=21050)
cursor = conn.cursor()
cursor.execute('SELECT * FROM mytable LIMIT 100')
df = as_pandas(cursor)
cursor.close()

参考资料

https://github.com/cloudera/impyla

以上就是如何在Win10系统使用Python3连接Hive的详细内容，更多关于Python3连接Hive的资料请关注其它相关文章！

推荐阅读

程序员
以功能方式从列表创建配对列表

如何解决《以功能方式从列表创建配对列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
Elasticsearch query_string命中字段

如何解决《Elasticsearchquery_string命中字段》经验，为你挑选了1个好方法。 ... [详细]
程序员
让Gvim与Powershell一起工作

如何解决《让Gvim与Powershell一起工作》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法定位元素的最后一个子元素

如何解决《无法定位元素的最后一个子元素》经验，为你挑选了1个好方法。 ... [详细]
程序员
为这个庞大的列表制作一个更紧凑的代码

如何解决《为这个庞大的列表制作一个更紧凑的代码》经验，为你挑选了1个好方法。 ... [详细]
程序员
加载角度视图

如何解决《加载角度视图》经验，为你挑选了0个好方法。 ... [详细]
程序员
当Div滚动到视线之外时检测

如何解决《当Div滚动到视线之外时检测》经验，为你挑选了1个好方法。 ... [详细]
程序员
选择要运行的配置类型时,在IntelliJ IDEA 15中运行Gradle测试而不是Junit测试

如何解决《选择要运行的配置类型时,在IntelliJIDEA15中运行Gradle测试而不是Junit测试》经验，为你挑选了2个好方法。 ... [详细]
程序员
Android多功能库模块用于应用程序模块

如何解决《Android多功能库模块用于应用程序模块》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用支持库23修复缩放的FloatingActionButton上的阴影

如何解决《如何使用支持库23修复缩放的FloatingActionButton上的阴影》经验，为你挑选了0个好方法。 ... [详细]
程序员
摆脱SVG圆形元素上的锯齿

如何解决《摆脱SVG圆形元素上的锯齿》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么我不能抓住我的例外？

如何解决《为什么我不能抓住我的例外？》经验，为你挑选了1个好方法。 ... [详细]
程序员
何时或为何在Oracle数据库中使用"SET DEFINE OFF"

如何解决《何时或为何在Oracle数据库中使用"SETDEFINEOFF"》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用std :: ptr_fun作为成员函数

如何解决《使用std::ptr_fun作为成员函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
确定Postgresql中的触发源

如何解决《确定Postgresql中的触发源》经验，为你挑选了0个好方法。 ... [详细]
程序员
Typescript使用Angular 2组件抛出声明预期错误

如何解决《Typescript使用Angular2组件抛出声明预期错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
在python字符串中突出显示SQL

如何解决《在python字符串中突出显示SQL》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在PostgreSQL的tryCatch中使用dbGetQuery？

如何解决《如何在PostgreSQL的tryCatch中使用dbGetQuery？》经验，为你挑选了1个好方法。 ... [详细]
程序员
用.减少Matlab表

如何解决《用.减少Matlab表》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何从lambda表达式返回一个值？

如何解决《如何从lambda表达式返回一个值？》经验，为你挑选了0个好方法。 ... [详细]

mobiledu2402852413

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章