sqoop使用

作者：贾志军 | 2021-09-09 16:03

sqoop是进出hadoop的重要工具。用sqoop从RDBMS中导入数据sqoopimport-Doozie.job.id$wf_job_id--自定义参数oozie相关-Dmapred.job.queue.name$mapred_job_queue_name--自定义参数oozie相关--connect$data_db_url--RDMSjdbc地

sqoop 是进出hadoop的重要工具。用sqoop从RDBMS中导入数据 sqoop import \ -D oozie.job.id=$wf_job_id \ -- 自定义参数 oozie 相关 -D mapred.job.queue.name=$mapred_job_queue_name \ -- 自定义参数 oozie 相关 --connect $data_db_url \ --RDMS jdbc地

sqoop 是进出hadoop的重要工具。

用sqoop从RDBMS中导入数据

sqoop import \
-D oozie.job.id=$wf_job_id \ -- 自定义参数 oozie 相关

-D mapred.job.queue.name=$mapred_job_queue_name \ -- 自定义参数 oozie 相关

--connect $data_db_url \ --RDMS jdbc地址
--username $data_db_username \ -RDBMS用户名
--password $data_db_password \ -RDBMS密码
--table $db_table \ -- RDBMS 表名
--columns $db_columns \ --导入字段，及其顺序
--verbose \
--target-dir $hdfs_target_dir \ ---HDFS目标文件夹
--fields-terminated-by '\001' \ ---字段分隔字符
--lines-terminated-by '\n' \ --- 行分隔字符
--hive-table $data_db_name.$hive_table \ --- hive表名
-m $parallel_count \ ---使用并发
--hive-import \ -- 使用hive开关
--hive-overwrite \ -- 是否覆盖写
--null-string '\\N' \ --空字段表示
--null-non-string '\\N' \
--hive-drop-import-delims

用sqoop 从 hadoop向RDBMS推送数据

使用 insert overwrite directory OOOO select * from XXXX; 将表XXXX 转换格式并导入HDFS中，准备推送

sqoop export \
-D oozie.job.id=$wf_job_id \
-D mapred.job.queue.name=$mapred_job_queue_name \
-D mapred.task.timeout=0 \
--connect $data_db_url \
--username $data_db_username \
--password $data_db_password \
--table ${table_name}_insert \
--export-dir $insert_dir \ --目标文件夹

--columns $db_columns \ --输出字段顺序（用于数据对其，非常重要）
--input-null-string '\\N' \
--input-null-non-string '\\N' \
--input-fields-terminated-by '\001' \ -- 字段隔离符号
-m ${parallel_count} \ 并发数量

推荐阅读

程序员
设置HTTPS连接的https.protocols系统属性的问题

如何解决《设置HTTPS连接的https.protocols系统属性的问题》经验，为你挑选了0个好方法。 ... [详细]
程序员
堆栈内存未释放

如何解决《堆栈内存未释放》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法在Ubuntu中执行adb.下载的文件适用于x86-64,而我有i686

如何解决《无法在Ubuntu中执行adb.下载的文件适用于x86-64,而我有i686》经验，为你挑选了1个好方法。 ... [详细]
程序员
vue.js $ watch对象数组

如何解决《vue.js$watch对象数组》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何向Symfony/Monolog日志输出添加其他信息(主机,URL等)？

如何解决《如何向Symfony/Monolog日志输出添加其他信息(主机,URL等)？》经验，为你挑选了2个好方法。 ... [详细]
程序员
ActiveMQ发送ObjectMessage

如何解决《ActiveMQ发送ObjectMessage》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python SUDS - 在调用SOAP方法时获取异常415

如何解决《PythonSUDS-在调用SOAP方法时获取异常415》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Golang中遇到gzip.Reader问题

如何解决《在Golang中遇到gzip.Reader问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
您可以缩放窗口构建器以查看更多设计吗？

如何解决《您可以缩放窗口构建器以查看更多设计吗？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何通过条带api分割付款？

如何解决《如何通过条带api分割付款？》经验，为你挑选了1个好方法。 ... [详细]
程序员
迭代不同类的同名对象

如何解决《迭代不同类的同名对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
COBOL嵌入式SQL

如何解决《COBOL嵌入式SQL》经验，为你挑选了1个好方法。 ... [详细]
程序员
基于Semantic-UI Grid的页面布局:无法移除排水沟

如何解决《基于Semantic-UIGrid的页面布局:无法移除排水沟》经验，为你挑选了0个好方法。 ... [详细]
程序员
IIS URL-重写:HTTP到HTTPS

如何解决《IISURL-重写:HTTP到HTTPS》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从方法设置枚举属性的值？

如何解决《如何从方法设置枚举属性的值？》经验，为你挑选了1个好方法。 ... [详细]
程序员
禁用单击按钮事件c#

如何解决《禁用单击按钮事件c#》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Eclipse中查找所有接口实例？

如何解决《如何在Eclipse中查找所有接口实例？》经验，为你挑选了1个好方法。 ... [详细]
程序员
直接运行程序和在脚本中调用exec有什么不同？

如何解决《直接运行程序和在脚本中调用exec有什么不同？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何输出堆栈创建成功信息,直到在堆栈中创建所有资源

如何解决《如何输出堆栈创建成功信息,直到在堆栈中创建所有资源》经验，为你挑选了1个好方法。 ... [详细]
程序员
在文本更改事件之前自动调用RxAndroid textview事件

如何解决《在文本更改事件之前自动调用RxAndroidtextview事件》经验，为你挑选了1个好方法。 ... [详细]

贾志军

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章