MySQL数据库与HDFS的实时数据同步

作者：jerry613 | 2021-08-03 02:16

通过Map/Reduce进行批处理递送到ApacheHadoop仍然是中枢环节。,但随着要从“超思维速度“分析方面获取竞争优势的压力递增

通过Map/Reduce进行批处理递送到Apache Hadoop仍然是中枢环节。,但随着要从“超思维速度“分析方面获取竞争优势的压力递增，因此Hadoop(分布式文件系统)自身经历重大的发展。科技的发展允许实时查询，如Apache Drill, Cloudera Impala和Stinger Initiative正脱颖而出，新一代的资源管理Apache YARN 支持这些。

为了支持这种日渐强调实时性操作,我们正发布一个新MySQL Applier for Hadoop(用于Hadoop的MySQL Applier)组件。它能够把MySQL中变化的事务复制到Hadoop / Hive / HDFS。Applier 组件补充现有基于批处理Apache Sqoop的连接性。

这个组件(MySQL Applier for Hadoop)的复制是通过连接MySQL主服务，一旦二进制日志被提交，就读取二进制日志事务，并且把它们写到HDFS.

这个组件使用libhdfs提供的API，一个C库操作HDFS中的文件。这库由Hadoop版本预编译生成的。

它连接MySQL主服务读二进制日志，然后：

?提取发生在主服务上的行插入事件

?解码事件,提取插入到行的每个字段的数据,并使用满意的处理程序得到被要求的格式数据。

?把它追加到HDFS 中一个文本文件。

数据库被映射为单独的目录,它们的表映射为子目录，保存在数据仓库目录。每个表的数据被写到Hive/ HDFS中文本文件(称为datafile1.txt)。数据可以用逗号格式分隔;或其他格式,那可用命令行参数来配置的

推荐阅读

程序员
如何限制ActiveDataProvider的查询？

如何解决《如何限制ActiveDataProvider的查询？》经验，为你挑选了1个好方法。 ... [详细]
程序员
C++预处理器连接操作

如何解决《C++预处理器连接操作》经验，为你挑选了1个好方法。 ... [详细]
程序员
解码Base64urlUInt编码的值

如何解决《解码Base64urlUInt编码的值》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android - OpenGL ES 2.0:模拟器(Works) - 设备(不)

如何解决《Android-OpenGLES2.0:模拟器(Works)-设备(不)》经验，为你挑选了0个好方法。 ... [详细]
程序员
Android Studio 2.0即时运行不起作用但出现此提示？

如何解决《AndroidStudio2.0即时运行不起作用但出现此提示？》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法使用iphonesimulator9.2构建模拟器

如何解决《无法使用iphonesimulator9.2构建模拟器》经验，为你挑选了2个好方法。 ... [详细]
程序员
两次指针自由调用

如何解决《两次指针自由调用》经验，为你挑选了1个好方法。 ... [详细]
程序员
设计模式以访问来自不同来源的相同数据

如何解决《设计模式以访问来自不同来源的相同数据》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用NewtonSoft将JSON对象反序列化为.Net对象

如何解决《使用NewtonSoft将JSON对象反序列化为.Net对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
返回+重置成员变量最有效的方法？

如何解决《返回+重置成员变量最有效的方法？》经验，为你挑选了4个好方法。 ... [详细]
程序员
提高Aurelia框架在移动设备上的性能

如何解决《提高Aurelia框架在移动设备上的性能》经验，为你挑选了1个好方法。 ... [详细]
程序员
Tomcat：使用数据库连接部署两个应用程序时出现HikariCP问题

如何解决《Tomcat：使用数据库连接部署两个应用程序时出现HikariCP问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
Gitblit推动被拒绝的原因没有在intelij-idea中显示

如何解决《Gitblit推动被拒绝的原因没有在intelij-idea中显示》经验，为你挑选了1个好方法。 ... [详细]
程序员
将div宽度内的文本框居中:100%在所有边留下一些边距

如何解决《将div宽度内的文本框居中:100%在所有边留下一些边距》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将DTO的ODataQueryOptions应用于基础EntitySet？

如何解决《如何将DTO的ODataQueryOptions应用于基础EntitySet？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Rails部署不显示生产中的图像

如何解决《Rails部署不显示生产中的图像》经验，为你挑选了1个好方法。 ... [详细]
程序员
Jails只在Rails应用程序中工作一次(在页面刷新后不是第二次)

如何解决《Jails只在Rails应用程序中工作一次(在页面刷新后不是第二次)》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在字符串中的特定符号之前获取字符串

如何解决《如何在字符串中的特定符号之前获取字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
R中的行乘法

如何解决《R中的行乘法》经验，为你挑选了1个好方法。 ... [详细]
程序员
csv:writer.writerows()拆分我的字符串输入

如何解决《csv:writer.writerows()拆分我的字符串输入》经验，为你挑选了1个好方法。 ... [详细]

jerry613

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章