Apache NiFi调优问题

作者：罗文彬2502852027 | 2023-07-11 15:08

如何解决《ApacheNiFi调优问题》经验，为你挑选了1个好方法。

我开发了一个用于HDFS数据摄取的NiFi流程原型.现在我想提高整体表现,但似乎我无法真正前进.

流接收输入csv文件(每行有80个字段),在行级别拆分,对字段应用一些转换(使用顺序执行的4个自定义处理器),将新行缓冲到csv文件中,将它们输出到HDFS.我以这样的方式开发了处理器:当读取每个单独的记录并且将其字段移动到flowfile属性时,仅访问流文件的内容一次.测试已在亚马逊EC2 m4.4xlarge实例(16核CPU,64 GB RAM)上进行.

这是我到目前为止所尝试的:

将flowfile存储库和内容存储库移动到不同的SSD驱动器上

将原产地存储库移到内存中(NiFi无法跟上事件发生率)

根据配置最佳实践配置系统

我已经尝试为每个处理器分配多个线程,以便达到不同数量的总线程

我已经尝试增加nifi.queue.swap.threshold并将背压设置为永远不会达到交换限制

尝试了不同的JVM内存设置,从8到32 GB(与G1GC结合使用)

我试过增加实例规范,没有任何改变

从我执行的监控来看,它看起来像磁盘不是瓶颈(它们在很长一段时间内基本上处于空闲状态,显示计算实际上是在内存中执行)并且平均CPU负载低于60%.

我能得到的最多的是215K行/分钟,这是3,5k行/秒. 就数量而言,它仅为4,7 MB/s.我的目标是肯定比这更大的东西.就像比较一样,我创建了一个读取文件的流程,将其拆分为行,将它们合并为块并将数据合并到磁盘上.在这里,我得到12k行/秒,或17 MB/s.看起来也不会太快,让我觉得我可能做错了.有没有人有关于如何提高表现的建议？在集群上运行NiFi而不是随实例规范增长,我将从中受益多少？谢谢你们

1> riccamini..：

事实证明,糟糕的表现是开发的自定义处理器和合并内容处理器的组合.在hortonworks社区论坛上反映的同样问题得到了有趣的反馈.

关于第一个问题,建议是将SupportsBatching注释添加到处理器.这允许处理器将多个提交批处理在一起,并允许NiFi用户通过配置菜单中的处理器执行来支持延迟或吞吐量.其他信息可以在这里的文档中找到.

另一个发现是MergeContent内置处理器本身似乎没有最佳性能,因此如果可能,应考虑修改流程并避免合并阶段.

推荐阅读

程序员
Laravel中的契约与PHP中的接口有什么区别？

如何解决《Laravel中的契约与PHP中的接口有什么区别？》经验，为你挑选了3个好方法。 ... [详细]
程序员
Angular2中的通用邮件验证程序

如何解决《Angular2中的通用邮件验证程序》经验，为你挑选了5个好方法。 ... [详细]
程序员
在Anaconda中安装Plotly

如何解决《在Anaconda中安装Plotly》经验，为你挑选了2个好方法。 ... [详细]
程序员
检测数字输入微调器点击

如何解决《检测数字输入微调器点击》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用自定义创建的地图框样式以及传单

如何解决《如何使用自定义创建的地图框样式以及传单》经验，为你挑选了1个好方法。 ... [详细]
程序员
比较std :: stringstream的内容

如何解决《比较std::stringstream的内容》经验，为你挑选了1个好方法。 ... [详细]
程序员
将UIScrollView委托设置为它自己的自定义类

如何解决《将UIScrollView委托设置为它自己的自定义类》经验，为你挑选了1个好方法。 ... [详细]
程序员
获取控制器中Spring启动/安全性的会话令牌

如何解决《获取控制器中Spring启动/安全性的会话令牌》经验，为你挑选了2个好方法。 ... [详细]
程序员
从数据库返回字符串值

如何解决《从数据库返回字符串值》经验，为你挑选了1个好方法。 ... [详细]
程序员
将自定义列添加到Magento报表和销售信息中心

如何解决《将自定义列添加到Magento报表和销售信息中心》经验，为你挑选了0个好方法。 ... [详细]
程序员
JSDoc的输出可以组织成"文件夹"吗？

如何解决《JSDoc的输出可以组织成"文件夹"吗？》经验，为你挑选了0个好方法。 ... [详细]
程序员
ES6导出/导入索引文件

如何解决《ES6导出/导入索引文件》经验，为你挑选了4个好方法。 ... [详细]
程序员
收集实时GC指标 - Golang

如何解决《收集实时GC指标-Golang》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在visual Studio 2013中阻止"尝试从状态为TextDocDataAvailable的适配器获取视图"失败？

如何解决《如何在visualStudio2013中阻止"尝试从状态为TextDocDataAvailable的适配器获取视图"失败？》经验，为你挑选了2个好方法。 ... [详细]
程序员
用于打开上次关闭选项卡的Sublime文本快捷方式

如何解决《用于打开上次关闭选项卡的Sublime文本快捷方式》经验，为你挑选了1个好方法。 ... [详细]
程序员
错误后重试相同的项目

如何解决《错误后重试相同的项目》经验，为你挑选了1个好方法。 ... [详细]
程序员
Cassandra create table不会保持列顺序

如何解决《Cassandracreatetable不会保持列顺序》经验，为你挑选了2个好方法。 ... [详细]
程序员
Android OkHttp库:GET请求 - 异常EOFException:\n未找到:size = 0 content =

如何解决《AndroidOkHttp库:GET请求-异常EOFException:\n未找到:size=0content=》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么"错误:使用unique_ptr将'sizeof'无效应用于不完整类型"通过添加空析构函数来修复？

如何解决《为什么"错误:使用unique_ptr将'sizeof'无效应用于不完整类型"通过添加空析构函数来修复？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java HashMap没有从key获得价值

如何解决《JavaHashMap没有从key获得价值》经验，为你挑选了1个好方法。 ... [详细]

罗文彬2502852027

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章