在我的情况下,Hadoop会给我更多的好处吗？

作者：女女的家_747 | 2023-06-21 16:06

如何解决《在我的情况下,Hadoop会给我更多的好处吗？》经验，为你挑选了1个好方法。

我正在使用Clojure每小时提取10个XML文件,每个文件大约10 MB.此脚本在服务器计算机上运行.
XML文件现在被解析并存储到RDBMS中(所有这些都是使用本机Clojure代码完成的).

考虑到我的情况,如果我使用Hadoop Map/Reduce解析XML文件,我会获得更多好处吗？还是会有点矫枉过正？

1> arun_suresh..：

在这种情况下使用Hadoop绝对是一种矫枉过正.如果你使用Hadoop解析10个文件,平行,

它会从每个Map任务中生成10个JVM

它可能会为reduce任务产生一个以上的JVM(当然,你可能只有一个地图hadoop作业,你不需要减少阶段)

在Map和Reduce阶段之间会有一个shuffle阶段,所有Map输出都通过网络发送到reduce节点

如果你的文件都是10 Mb的最大值,那么我没有看到太多的优势,你将从JVM启动和过多的IO中获得显着的开销.

我想你应该考虑Hadoop一旦你跨越每个文件100 - 150 Mb

推荐阅读

程序员
如何在Windows上安装igraph for python

如何解决《如何在Windows上安装igraphforpython》经验，为你挑选了1个好方法。 ... [详细]
程序员
试图将R中的岩石,纸张,剪刀游戏随机化

如何解决《试图将R中的岩石,纸张,剪刀游戏随机化》经验，为你挑选了3个好方法。 ... [详细]
程序员
Ramda.js:要列出的参数

如何解决《Ramda.js:要列出的参数》经验，为你挑选了1个好方法。 ... [详细]
程序员
防止在OS X中启动时出现iCloud打开文件对话框

如何解决《防止在OSX中启动时出现iCloud打开文件对话框》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Swift中使用Map来更改自定义结构属性

如何解决《在Swift中使用Map来更改自定义结构属性》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何从npm运行的bash脚本中打印$ 2 BEFORE？

如何解决《如何从npm运行的bash脚本中打印$2BEFORE？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Kubernetes kubelet原木在哪里？

如何解决《Kuberneteskubelet原木在哪里？》经验，为你挑选了2个好方法。 ... [详细]
程序员
AngularJS的$ routeProvider templateUrl总是使用Express返回404

如何解决《AngularJS的$routeProvidertemplateUrl总是使用Express返回404》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用Elixir语言将模块加载到另一个模块中？

如何解决《如何使用Elixir语言将模块加载到另一个模块中？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在CSS中设置超薄"font-weight"(小于100)？

如何解决《如何在CSS中设置超薄"font-weight"(小于100)？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将梯形转向对面？

如何解决《如何将梯形转向对面？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Kubernetes NFS卷安装失败,退出状态为32

如何解决《KubernetesNFS卷安装失败,退出状态为32》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Node.JS中向自定义函数添加响应对象

如何解决《如何在Node.JS中向自定义函数添加响应对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么Python在尝试计算非常大的数字时会"先发制人"地挂起？

如何解决《为什么Python在尝试计算非常大的数字时会"先发制人"地挂起？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在Android Studio中为Kotlin设置自动导入？

如何解决《如何在AndroidStudio中为Kotlin设置自动导入？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用Swift将精灵旋转到精灵位置不精确的SpriteKit中

如何解决《使用Swift将精灵旋转到精灵位置不精确的SpriteKit中》经验，为你挑选了0个好方法。 ... [详细]
程序员
Web API和取消令牌

如何解决《WebAPI和取消令牌》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Centos 7中,mysqld.service的作业失败了

如何解决《在Centos7中,mysqld.service的作业失败了》经验，为你挑选了1个好方法。 ... [详细]
程序员
Slimframwork中的singleton和set之间有什么不同？

如何解决《Slimframwork中的singleton和set之间有什么不同？》经验，为你挑选了1个好方法。 ... [详细]
程序员
HttpContext.Current.Session - NullReferenceException

如何解决《HttpContext.Current.Session-NullReferenceException》经验，为你挑选了1个好方法。 ... [详细]

女女的家_747

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章