ETL框架需要哪些功能？

作者：郑小蒜9299_941611_G | 2023-08-20 17:32

如何解决《ETL框架需要哪些功能？》经验，为你挑选了1个好方法。

我正在编写一个ETL(在带有mongodb后端的python中)并且想知道:ETL应该被称为ETL的标准函数和工具是什么？

该ETL将尽可能通用,采用可编写脚本的模块化方法.它主要用于保持不同的数据库同步,以及以不同的格式导入/导出数据集(xml和csv)我不需要任何多维工具,但它有可能以后需要它.

1> S.Lott..：

让我们暂时考虑ETL用例.

提取.

通过通用DB-API适配器读取数据库.

通过类似的适配器读取平面文件.

通过类似的适配器读取电子表格.

洁净.

任意规则

过滤并拒绝

更换

添加数据列

档案数据.

统计频率表.

转换(请参阅清理,它们是具有相同实现的两个用例)

进行维度一致性查找.

替换值或添加值.

骨料.

在管道中的任何一点

加载.

或者准备一个平面文件并运行DB产品的加载器.

此外,还有一些额外的要求不是单一用例.

每个单独的操作必须是一个单独的进程,可以在Unix管道中连接,各个记录在进程之间流动.这使用了所有 CPU资源.

对于无法推理出ETL前置条件的地方,您需要某种基于时间的调度程序.

对于可以找出ETL处理步骤的前提条件的场所,您需要基于事件的计划.

注意.由于ETL是I/O绑定的,因此多线程对您没有好处.由于每个进程运行很长时间 - 特别是如果要处理数千行数据 - "重量级"进程的开销不会受到影响.

推荐阅读

程序员
C#WinForm多次单击事件处理程序以实现类似功能

如何解决《C#WinForm多次单击事件处理程序以实现类似功能》经验，为你挑选了1个好方法。 ... [详细]
程序员
html,正文100%导致滚动条出现

如何解决《html,正文100%导致滚动条出现》经验，为你挑选了1个好方法。 ... [详细]
程序员
SFSafariViewController完成按钮不起作用

如何解决《SFSafariViewController完成按钮不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
从外部调用webpacked代码(HTML脚本标记)

如何解决《从外部调用webpacked代码(HTML脚本标记)》经验，为你挑选了3个好方法。 ... [详细]
程序员
python .get()和None

如何解决《python.get()和None》经验，为你挑选了1个好方法。 ... [详细]
程序员
将变量从子表单传递给父表单

如何解决《将变量从子表单传递给父表单》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何列出类的所有方法(不是扩展和包含的方法)

如何解决《如何列出类的所有方法(不是扩展和包含的方法)》经验，为你挑选了1个好方法。 ... [详细]
程序员
将2D数组附加到3D数组,扩展第三维

如何解决《将2D数组附加到3D数组,扩展第三维》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么malloc在全局命名空间中？

如何解决《为什么malloc在全局命名空间中？》经验，为你挑选了1个好方法。 ... [详细]
程序员
PDF Miner PDFEncryptionError

如何解决《PDFMinerPDFEncryptionError》经验，为你挑选了1个好方法。 ... [详细]
程序员
R CMD检查指定的库路径

如何解决《RCMD检查指定的库路径》经验，为你挑选了1个好方法。 ... [详细]
程序员
在处理大型集合时优化jQuery selector/addBack()

如何解决《在处理大型集合时优化jQueryselector/addBack()》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用ceil或round时对成员的模糊引用

如何解决《使用ceil或round时对成员的模糊引用》经验，为你挑选了1个好方法。 ... [详细]
程序员
改变UINavigationBar的模糊效果

如何解决《改变UINavigationBar的模糊效果》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何识别javascript不可删除的属性？

如何解决《如何识别javascript不可删除的属性？》经验，为你挑选了1个好方法。 ... [详细]
程序员
WordPress rest API OAuth curl命令

如何解决《WordPressrestAPIOAuthcurl命令》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Elixir中,如何使用字符串插值格式化数字

如何解决《在Elixir中,如何使用字符串插值格式化数字》经验，为你挑选了3个好方法。 ... [详细]
程序员
如何阻止Avro自动装箱原始类型？

如何解决《如何阻止Avro自动装箱原始类型？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Visual Studio 2015,使用GIT扩展,以及数据库项目.dbmdl文件

如何解决《VisualStudio2015,使用GIT扩展,以及数据库项目.dbmdl文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
nodejs stream.Readable.push()返回值的语义是什么

如何解决《nodejsstream.Readable.push()返回值的语义是什么》经验，为你挑选了1个好方法。 ... [详细]

郑小蒜9299_941611_G

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章