实现Hive数据同步更新的shell脚本

作者：臭小子 | 2021-09-10 00:05

上一篇文章《Sqoop1.4.4实现将Oracle10g中的增量数据导入Hive0.13.1，并更新Hive中的主表》描述了增量更新Hive表的原理和Sq

上一篇文章《Sqoop1.4.4 实现将 Oracle10g 中的增量数据导入 Hive0.13.1 ，并更新Hive中的主表》描述了增量更新Hive表的原理和Sq

引言：

上一篇文章《Sqoop1.4.4 实现将 Oracle10g 中的增量数据导入 Hive0.13.1 ，，并更新Hive中的主表

shell脚本

#!/bin/bash

#Please set the synchronize interval,unit is hour.

update_interval=24

#Please set the RDBMS connection params

rdbms_connstr="jdbc:oracle:thin:@192.168.0.147:1521:ORCLGBK"

rdbms_username="SP"

rdbms_pwd="fulong"

rdbms_table="OMP_SERVICE"

rdbms_columns="ID,SERVICE_NAME,SERVICE_PROCESS,CREATE_TIME,ENABLE_ORG,ENABLE_PLATFORM,IF_DEL"

#Please set the hive params

hive_increment_table="SERVICE_TMP"

hive_full_table="service_all"

#---------------------------------------------------------

#Import icrement data in RDBMS into Hive

enddate=$(date '+%Y/%m/%d %H:%M:%S')

startdate=$(date '+%Y/%m/%d %H:%M:%S' -d '-'+${update_interval}+' hours')

$SQOOP_HOME/bin/sqoop import --connect ${rdbms_connstr} --username ${rdbms_username} --password ${rdbms_pwd} --table ${rdbms_table} --columns "${rdbms_columns}" --where "CREATE_TIME > to_date('${startdate}','yyyy-mm-dd hh24:mi:ss') and CREATE_TIME < to_date('${enddate}','yyyy-mm-dd hh24:mi:ss')" --hive-import --hive-overwrite --hive-table ${hive_increment_table}

#---------------------------------------------------------

#Update the old full data table to latest status

$HIVE_HOME/bin/hive -e "insert overwrite table ${hive_full_table} select * from ${hive_increment_table} union all select a.* from ${hive_full_table} a left outer join ${hive_increment_table} b on a.service_code = b.service_code where b.service_code is null;"

注意：

在shell脚本中执行hive hql的命令格式是 hive -e "select ..."

Cron脚本

添加定时任务每天凌晨2点执行该脚本

0 2 * * * /home/fulong/shell/dataSync.sh

基于Hadoop集群的Hive安装

Hive内表和外表的区别

Hadoop + Hive + Map +reduce 集群安装部署

Hive本地独立模式安装

Hive学习之WordCount单词统计

Hive运行架构及配置部署

Hive 的详细介绍：请点这里
Hive 的下载地址：请点这里

推荐阅读

程序员
如何更改"默认"docker-machine的dns设置

如何解决《如何更改"默认"docker-machine的dns设置》经验，为你挑选了1个好方法。 ... [详细]
程序员
求解R中的微分方程组

如何解决《求解R中的微分方程组》经验，为你挑选了0个好方法。 ... [详细]
程序员
CMake - 如何在目录名称中获得第二个最后一个？

如何解决《CMake-如何在目录名称中获得第二个最后一个？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将日期更改为Datetimepicker插件一天

如何解决《将日期更改为Datetimepicker插件一天》经验，为你挑选了1个好方法。 ... [详细]
程序员
Pandas dropna - 商店掉线

如何解决《Pandasdropna-商店掉线》经验，为你挑选了1个好方法。 ... [详细]
程序员
具有Bootstrap的Chart.JS全宽响应式甜甜圈图

如何解决《具有Bootstrap的Chart.JS全宽响应式甜甜圈图》经验，为你挑选了1个好方法。 ... [详细]
程序员
在C++ 98模式下在Visual Studio 2015中运行项目

如何解决《在C++98模式下在VisualStudio2015中运行项目》经验，为你挑选了1个好方法。 ... [详细]
程序员
生成自定义JSON数组

如何解决《生成自定义JSON数组》经验，为你挑选了0个好方法。 ... [详细]
程序员
传入更新的Telegram bot api限制

如何解决《传入更新的Telegrambotapi限制》经验，为你挑选了1个好方法。 ... [详细]
程序员
1个字母到3个字母的氨基酸变体

如何解决《1个字母到3个字母的氨基酸变体》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何获取DomElement的字符串？

如何解决《如何获取DomElement的字符串？》经验，为你挑选了1个好方法。 ... [详细]
程序员
看不出为什么我得到"比较方法违反其一般合同"的错误

如何解决《看不出为什么我得到"比较方法违反其一般合同"的错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
升级Xampp以运行php 7

如何解决《升级Xampp以运行php7》经验，为你挑选了2个好方法。 ... [详细]
程序员
C - 如何读取长度未知的字符串

如何解决《C-如何读取长度未知的字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
从服务器关闭akka-http websocket连接

如何解决《从服务器关闭akka-httpwebsocket连接》经验，为你挑选了1个好方法。 ... [详细]
程序员
将包括其他值的最重复值排在前面

如何解决《将包括其他值的最重复值排在前面》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Text Kit使用UITextView插入UITextFields？

如何解决《使用TextKit使用UITextView插入UITextFields？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用指针实现strcat()

如何解决《使用指针实现strcat()》经验，为你挑选了1个好方法。 ... [详细]
程序员
有没有办法修改正在运行的倒计时？

如何解决《有没有办法修改正在运行的倒计时？》经验，为你挑选了0个好方法。 ... [详细]
程序员
CSS3动画 - 使用转换时不会触发animationstart事件:

如何解决《CSS3动画-使用转换时不会触发animationstart事件:》经验，为你挑选了1个好方法。 ... [详细]

臭小子

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章