MySQL添加Hadoop数据实时复制功能

作者：小妖694_807 | 2021-08-03 00:48

MySQL复制操作可以将数据从一个MySQL服务器(主)复制到其他的一个或多个MySQL服务器(从)。试想一下，如果从服务器不再局限为一个MySQL服务器，而是其他任何数据库服务器或平台，并且复制事件要求实时进行，是否可以实现呢?

　　MySQL团队最新推出的 MySQL Applier for Hadoop(以下简称Hadoop Applier)旨在解决这一问题。

　　用途

　　例如，复制事件中的从服务器可能是一个数据仓库系统，如Apache Hive，它使用Hadoop分布式文件系统(HDFS)作为数据存储区。如果你有一个与HDFS相关的Hive元存储，Hadoop Applier就可以实时填充Hive数据表。数据是从MySQL中以文本文件形式导出到HDFS，然后再填充到Hive。

　　操作很简单，只需在Hive运行HiveQL语句'CREATE TABLE'，定义表的结构与MySQL相似，然后运行Hadoop Applier即可开始实时复制数据。

　　优势

　　在Hadoop Applier之前，还没有任何工具可以执行实时传输。之前的解决方案是通过Apache Sqoop导出数据到HDFS，尽管可以批量传输，但是需要经常将结果重复导入以保持数据更新。在进行大量数据传输时，其他查询会变得很慢。且在数据库较大的情况下，如果只进行了一点更改，Sqoop可能也需要较长时间来加载。

　　而Hadoop Applier则会读取二进制日志，只应用MySQL服务器上发生的事件，并插入数据，不需要批量传输，操作更快，因此并不影响其他查询的执行速度。

　　实现

　　Applier使用一个由libhdfs(用于操作HDFS中文件的C库)提供的API。实时导入的过程如下图所示：

MySQL添加Hadoop数据实时复制功能

　　数据库被映射作为一个单独的目录，它们的表被映射作为子目录和一个Hive数据仓库目录。插入到每个表中的数据被写入文本文件(命名如datafile1.txt)，数据以逗号或其他符号分割(可通过命令行进行配置)。

推荐阅读

程序员
适配器类中的super.onActivityResult？Android的

如何解决《适配器类中的super.onActivityResult？Android的》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用bash进程替换和尾部的结果不正确？

如何解决《使用bash进程替换和尾部的结果不正确？》经验，为你挑选了1个好方法。 ... [详细]
程序员
自定义构建键绑定sublime文本

如何解决《自定义构建键绑定sublime文本》经验，为你挑选了1个好方法。 ... [详细]
程序员
由从未引用的对象创建的垃圾

如何解决《由从未引用的对象创建的垃圾》经验，为你挑选了1个好方法。 ... [详细]
程序员
SymbolFinder.FindReferencesAsync找不到任何内容

如何解决《SymbolFinder.FindReferencesAsync找不到任何内容》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否有一个基本的角度指令用于读取更多/更少的文本

如何解决《是否有一个基本的角度指令用于读取更多/更少的文本》经验，为你挑选了0个好方法。 ... [详细]
程序员
Firebase未向REST请求添加CORS标头

如何解决《Firebase未向REST请求添加CORS标头》经验，为你挑选了1个好方法。 ... [详细]
程序员
long-poll jQuery.ajax()在手机休眠后无法回调？

如何解决《long-polljQuery.ajax()在手机休眠后无法回调？》经验，为你挑选了0个好方法。 ... [详细]
程序员
iOS UI测试在一个被隔绝的看法

如何解决《iOSUI测试在一个被隔绝的看法》经验，为你挑选了2个好方法。 ... [详细]
程序员
番茄钟计时器:变量值变为'NaN'

如何解决《番茄钟计时器:变量值变为'NaN'》经验，为你挑选了0个好方法。 ... [详细]
程序员
向UITableViewCell Swift添加渐变背景

如何解决《向UITableViewCellSwift添加渐变背景》经验，为你挑选了1个好方法。 ... [详细]
程序员
码头工人-PG :: ConnectionBad

如何解决《码头工人-PG::ConnectionBad》经验，为你挑选了0个好方法。 ... [详细]
程序员
React.js - 实现组件的排序

如何解决《React.js-实现组件的排序》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python中的Bokeh包：如何使用rgb进行颜色选择

如何解决《Python中的Bokeh包：如何使用rgb进行颜色选择》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Xcode的测试类助手编辑器和Swift类

如何解决《使用Xcode的测试类助手编辑器和Swift类》经验，为你挑选了0个好方法。 ... [详细]
程序员
在RichTextBox中显示NLog跟踪

如何解决《在RichTextBox中显示NLog跟踪》经验，为你挑选了1个好方法。 ... [详细]
程序员
bash脚本无法读取第一行

如何解决《bash脚本无法读取第一行》经验，为你挑选了1个好方法。 ... [详细]
程序员
大熊猫建立在Cygwin上

如何解决《大熊猫建立在Cygwin上》经验，为你挑选了1个好方法。 ... [详细]
程序员
路易吉:一步一步的指示不起作用

如何解决《路易吉:一步一步的指示不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
C#使自动ToString转换无效

如何解决《C#使自动ToString转换无效》经验，为你挑选了1个好方法。 ... [详细]

小妖694_807

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章