MySQL添加Hadoop数据实时复制功能

作者：k78283381 | 2021-08-03 00:47

MySQL复制操作可以将数据从一个MySQL服务器(主)复制到其他的一个或多个MySQL服务器(从)。试想一下，如果从服务器不再局限为一个MySQL服务器，而是其他任何数据库服务器或平台，并且复制事件要求实时进行，是否可以实现呢?

MySQL复制操作可以将数据从一个MySQL服务器(主)复制到其他的一个或多个MySQL服务器(从)。试想一下，如果从服务器不再局限为一个MySQL服务器，而是其他任何数据库服务器或平台，并且复制事件要求实时进行，是否可以实现呢?

　　MySQL团队最新推出的 MySQL Applier for Hadoop(以下简称Hadoop Applier)旨在解决这一问题。

　　用途

　　例如，复制事件中的从服务器可能是一个数据仓库系统，如Apache Hive，它使用Hadoop分布式文件系统(HDFS)作为数据存储区。如果你有一个与HDFS相关的Hive元存储，Hadoop Applier就可以实时填充Hive数据表。数据是从MySQL中以文本文件形式导出到HDFS，然后再填充到Hive。

　　操作很简单，只需在Hive运行HiveQL语句"CREATE TABLE"，定义表的结构与MySQL相似，然后运行Hadoop Applier即可开始实时复制数据。

　　优势

　　在Hadoop Applier之前，还没有任何工具可以执行实时传输。之前的解决方案是通过Apache Sqoop导出数据到HDFS，尽管可以批量传输，但是需要经常将结果重复导入以保持数据更新。在进行大量数据传输时，其他查询会变得很慢。且在数据库较大的情况下，如果只进行了一点更改，Sqoop可能也需要较长时间来加载。

　　而Hadoop Applier则会读取二进制日志，只应用MySQL服务器上发生的事件，并插入数据，不需要批量传输，操作更快，因此并不影响其他查询的执行速度。

　　实现

　　Applier使用一个由libhdfs(用于操作HDFS中文件的C库)提供的API。实时导入的过程如下图所示：

　　数据库被映射作为一个单独的目录，它们的表被映射作为子目录和一个Hive数据仓库目录。插入到每个表中的数据被写入文本文件(命名如datafile1.txt)，数据以逗号或其他符号分割(可通过命令行进行配置)。

推荐阅读

程序员
R tuneRF不稳定，如何优化？

如何解决《RtuneRF不稳定，如何优化？》经验，为你挑选了1个好方法。 ... [详细]
程序员
安全规则:检查空身份验证

如何解决《安全规则:检查空身份验证》经验，为你挑选了1个好方法。 ... [详细]
程序员
运行DSharp示例时出现错误信息

如何解决《运行DSharp示例时出现错误信息》经验，为你挑选了1个好方法。 ... [详细]
程序员
JS兼容Haxe承诺？

如何解决《JS兼容Haxe承诺？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在C++中重载了==和!=运算符

如何解决《在C++中重载了==和!=运算符》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将对象转换为对象数组(或对象集合)

如何解决《如何将对象转换为对象数组(或对象集合)》经验，为你挑选了2个好方法。 ... [详细]
程序员
SWIFT - LocationManager循环多次？

如何解决《SWIFT-LocationManager循环多次？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Iphone Phonegap中播放内联视频

如何解决《如何在IphonePhonegap中播放内联视频》经验，为你挑选了1个好方法。 ... [详细]
程序员
输入参数'd'在D3.js函数中意味着什么？

如何解决《输入参数'd'在D3.js函数中意味着什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从Instagram API获取历史数据

如何解决《如何从InstagramAPI获取历史数据》经验，为你挑选了0个好方法。 ... [详细]
程序员
Python:如何重置乌龟图形窗口

如何解决《Python:如何重置乌龟图形窗口》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Java中每1秒检查一次某些条件，直到达到true

如何解决《如何在Java中每1秒检查一次某些条件，直到达到true》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在pycharm中使用多处理时进行调试

如何解决《如何在pycharm中使用多处理时进行调试》经验，为你挑选了1个好方法。 ... [详细]
程序员
Go程序挂在Windows 10上

如何解决《Go程序挂在Windows10上》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在python中优化word_count

如何解决《如何在python中优化word_count》经验，为你挑选了1个好方法。 ... [详细]
程序员
Callable概念和std :: is_function类型特征之间有什么区别？

如何解决《Callable概念和std::is_function类型特征之间有什么区别？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Rails 4 - request.original_fullpath和request.fullpath之间有什么区别

如何解决《Rails4-request.original_fullpath和request.fullpath之间有什么区别》经验，为你挑选了1个好方法。 ... [详细]
程序员
执行WebAPI 2 JSON Post时找不到HttpRequestBase.GetBufferedInputStream

如何解决《执行WebAPI2JSONPost时找不到HttpRequestBase.GetBufferedInputStream》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在MVC中的JavaScript中传递url.action中的多个参数？

如何解决《如何在MVC中的JavaScript中传递url.action中的多个参数？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用map和join渲染react组件

如何解决《如何使用map和join渲染react组件》经验，为你挑选了5个好方法。 ... [详细]

k78283381

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章