6赞

如何在python中写hive脚本

作者：贾志军 | 2021-10-20 23:19

这篇文章主要介绍了如何在python中写hive脚本,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

1、直接执行.sql脚本

import numpy as np
import pandas as pd
import lightgbm as lgb
from pandas import DataFrame
from sklearn.model_selection import train_test_split
from io import StringIO
import gc
import sys
import os
hive_cmd = "hive -f ./sql/sql.sql"
output = os.popen(hive_cmd)
data_cart_prop = pd.read_csv(StringIO(unicode(output.read(),'utf-8')), sep="\t",header=0)

2、Hive语句执行

假如有如下hive sql：

hive_cmd = 'hive -e "select count(*) from hbase.routermac_sort_10;"'

一般在python中按照如下方式执行该hive sql：

os.system(hive_cmd)

---------------------

hive_cmd1 = "hive -f ./user.sql"
output1 = os.popen(hive_cmd1)
test_user = pd.read_csv(StringIO(unicode(output1.read(),'utf-8')), sep="\t",header=0)
 
hive_cmd2 = "hive -f ./action.sql"
output2 = os.popen(hive_cmd2)
test_action = pd.read_csv(StringIO(unicode(output2.read(),'utf-8')), sep="\t",header=0)
 
hive_cmd3 = "hive -f ./click.sql"
output3 = os.popen(hive_cmd3)
test_click = pd.read_csv(StringIO(unicode(output3.read(),'utf-8')), sep="\t",header=0)

为了显示表头，在脚本中加上一句：set hive.cli.print.header=true;

或者，使用如下语句：

hive_cmd = 'hive -e "set hive.cli.print.header=true;SELECT * FROM dev.temp_dev_jypt_decor_user_label_phase_one_view_feature WHERE(dt = "2018-09-17");"'
output = os.popen(hive_cmd)
data_cart_prop = pd.read_csv(StringIO(unicode(output.read(),'utf-8')), sep="\t",header=0)

3、tf 显存占用

import tensorflow as tf
tf.enable_eager_execution()
x = tf.get_variable('x', shape=[1], initializer=tf.constant_initializer(3.))
with tf.GradientTape() as tape:   
  y = tf.square(x)
  y_grad = tape.gradient(y, x)    
print([y.numpy(), y_grad.numpy()])

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

推荐阅读

程序员
如何使用process.hrtime来获取异步函数的执行时间

如何解决《如何使用process.hrtime来获取异步函数的执行时间》经验，为你挑选了1个好方法。 ... [详细]
程序员
为文件存储预分配驱动器空间

如何解决《为文件存储预分配驱动器空间》经验，为你挑选了2个好方法。 ... [详细]
程序员
在C++头文件中声明和定义静态变量？

如何解决《在C++头文件中声明和定义静态变量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Maven构建JavaFX 8

如何解决《使用Maven构建JavaFX8》经验，为你挑选了1个好方法。 ... [详细]
程序员
Firebird:在iSQL中查询执行时间

如何解决《Firebird:在iSQL中查询执行时间》经验，为你挑选了1个好方法。 ... [详细]
程序员
Django Admin：在选择列表中订购商品

如何解决《DjangoAdmin：在选择列表中订购商品》经验，为你挑选了1个好方法。 ... [详细]
程序员
' - 上游'做什么？

如何解决《'-上游'做什么？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何动态更新Ember.Route模型？

如何解决《如何动态更新Ember.Route模型？》经验，为你挑选了0个好方法。 ... [详细]
程序员
List-View控件忽略扩展样式

如何解决《List-View控件忽略扩展样式》经验，为你挑选了1个好方法。 ... [详细]
程序员
在使用纯函数式编程构建的游戏中,一个玩家怎么会对另一个玩家造成伤害(改变状态)呢？

如何解决《在使用纯函数式编程构建的游戏中,一个玩家怎么会对另一个玩家造成伤害(改变状态)呢？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用X509Certificate2(JwtSecurityTokenHandler)保护JWT

如何解决《使用X509Certificate2(JwtSecurityTokenHandler)保护JWT》经验，为你挑选了1个好方法。 ... [详细]
程序员
Control.Dispatcher.BeginInvoke()和Control.Dispatcher.Invoke()命令执行令人困惑？

如何解决《Control.Dispatcher.BeginInvoke()和Control.Dispatcher.Invoke()命令执行令人困惑？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Angular中方括号使用的目的是什么？

如何解决《Angular中方括号使用的目的是什么？》经验，为你挑选了3个好方法。 ... [详细]
程序员
两个编译器彼此不喜欢

如何解决《两个编译器彼此不喜欢》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何过滤列表

如何解决《如何过滤列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
找出连续3天缺席的员工

如何解决《找出连续3天缺席的员工》经验，为你挑选了1个好方法。 ... [详细]
程序员
冒号的前置和追加之间的区别(:项目与项目:)

如何解决《冒号的前置和追加之间的区别(:项目与项目:)》经验，为你挑选了2个好方法。 ... [详细]
程序员
TextReader.ReadToEnd vs Stream.CopyTo

如何解决《TextReader.ReadToEndvsStream.CopyTo》经验，为你挑选了1个好方法。 ... [详细]
程序员
将rails中的列从integer更改为float

如何解决《将rails中的列从integer更改为float》经验，为你挑选了1个好方法。 ... [详细]
程序员
从ksh获取包含env变量的文件

如何解决《从ksh获取包含env变量的文件》经验，为你挑选了1个好方法。 ... [详细]

贾志军

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章