MySQL推出Applier，可实时复制数据到Hadoop

作者：U友50081205_653 | 2021-08-03 00:52

MySQL复制操作可以将数据从一个MySQL服务器（主）复制到其他的一个或多个MySQL服务器（从）。试想一下，如果从服务器不再局限为一个MySQL服务器，而是其他任何数据库服务器或平台，并且复制事件要求实时进行，是否可以实现呢？

MySQL复制操作可以将数据从一个MySQL服务器（主）复制到其他的一个或多个MySQL服务器（从）。试想一下，如果从服务器不再局限为一个MySQL服务器，而是其他任何数据库服务器或平台，并且复制事件要求实时进行，是否可以实现呢？

MySQL团队最新推出的 MySQL Applier for Hadoop（以下简称Hadoop Applier）旨在解决这一问题。

用途

例如，复制事件中的从服务器可能是一个数据仓库系统，如Apache Hive，它使用Hadoop分布式文件系统（HDFS）作为数据存储区。如果你有一个与HDFS相关的Hive元存储，Hadoop Applier就可以实时填充Hive数据表。数据是从MySQL中以文本文件形式导出到HDFS，然后再填充到Hive。

操作很简单，只需在Hive运行HiveQL语句'CREATE TABLE'，定义表的结构与MySQL相似，然后运行Hadoop Applier即可开始实时复制数据。

优势

在Hadoop Applier之前，还没有任何工具可以执行实时传输。之前的解决方案是通过Apache Sqoop导出数据到HDFS，尽管可以批量传输，但是需要经常将结果重复导入以保持数据更新。在进行大量数据传输时，其他查询会变得很慢。且在数据库较大的情况下，如果只进行了一点更改，Sqoop可能也需要较长时间来加载。

而Hadoop Applier则会读取二进制日志，只应用MySQL服务器上发生的事件，并插入数据，不需要批量传输，操作更快，因此并不影响其他查询的执行速度。

实现

Applier使用一个由libhdfs（用于操作HDFS中文件的C库）提供的API。实时导入的过程如下图所示：

数据库被映射作为一个单独的目录，它们的表被映射作为子目录和一个Hive数据仓库目录。插入到每个表中的数据被写入文本文件（命名如datafile1.txt），数据以逗号或其他符号分割（可通过命令行进行配置）。

详细信息：MySQL Applier for Hadoop

下载地址：mysql-hadoop-applier-0.1.0-alpha.tar.gz（alpha版本，不可用于生产环境）

推荐阅读

程序员
名称和存在的functor或monad链接和终止操作序列

如何解决《名称和存在的functor或monad链接和终止操作序列》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Scheme或STk中,函数将显示为过程或闭包,但为什么LISP会出错？

如何解决《在Scheme或STk中,函数将显示为过程或闭包,但为什么LISP会出错？》经验，为你挑选了2个好方法。 ... [详细]
程序员
Seaborn Pairplot Pearsons P统计

如何解决《SeabornPairplotPearsonsP统计》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么这是这个程序的输出？

如何解决《为什么这是这个程序的输出？》经验，为你挑选了1个好方法。 ... [详细]
程序员
循环遍历列表会抛出超出界限的异常C#

如何解决《循环遍历列表会抛出超出界限的异常C#》经验，为你挑选了1个好方法。 ... [详细]
程序员
程序执行后如何删除"完成"消息？

如何解决《程序执行后如何删除"完成"消息？》经验，为你挑选了1个好方法。 ... [详细]
程序员
我的旧网站是否被正确重定向？

如何解决《我的旧网站是否被正确重定向？》经验，为你挑选了0个好方法。 ... [详细]
程序员
java.util.HashMap在Kotlin中没有实现java.util.Map吗？

如何解决《java.util.HashMap在Kotlin中没有实现java.util.Map吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否有返回ES6承诺的setTimeout版本？

如何解决《是否有返回ES6承诺的setTimeout版本？》经验，为你挑选了1个好方法。 ... [详细]
程序员
`std :: terminate`如何知道特别处理`std :: exception`s？

如何解决《`std::terminate`如何知道特别处理`std::exception`s？》经验，为你挑选了1个好方法。 ... [详细]
程序员
LLVM(3.5+)PassManager与LegacyPassManager

如何解决《LLVM(3.5+)PassManager与LegacyPassManager》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何获得ESPN开发人员密钥？

如何解决《如何获得ESPN开发人员密钥？》经验，为你挑选了1个好方法。 ... [详细]
程序员
iOS可重用组件

如何解决《iOS可重用组件》经验，为你挑选了1个好方法。 ... [详细]
程序员
cqrs与cqs之间的差异

如何解决《cqrs与cqs之间的差异》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用javascript或jquery模拟ctrl +单击(打开没有焦点的新选项卡)

如何解决《使用javascript或jquery模拟ctrl+单击(打开没有焦点的新选项卡)》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用ggplot2插入地图

如何解决《使用ggplot2插入地图》经验，为你挑选了0个好方法。 ... [详细]
程序员
Xcode项目中的Jpeg图片报告无效

如何解决《Xcode项目中的Jpeg图片报告无效》经验，为你挑选了1个好方法。 ... [详细]
程序员
lubridate masking dplyr"union"但加载时没有掩码消息

如何解决《lubridatemaskingdplyr"union"但加载时没有掩码消息》经验，为你挑选了0个好方法。 ... [详细]
程序员
c ++函数指针没有改变

如何解决《c++函数指针没有改变》经验，为你挑选了0个好方法。 ... [详细]
程序员
只需使用Immutable.js将对象分配给变量,即可克隆新对象

如何解决《只需使用Immutable.js将对象分配给变量,即可克隆新对象》经验，为你挑选了0个好方法。 ... [详细]

U友50081205_653

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章