使用零减速器时,我可以从Hadoop获得不经常分类的Mapper输出吗？

作者：mobiledu2402852357 | 2023-07-06 19:25

如何解决《使用零减速器时,我可以从Hadoop获得不经常分类的Mapper输出吗？》经验，为你挑选了0个好方法。

我在Hadoop 0.20中有一份工作需要对大文件进行操作,一次一个.(这是一个预处理步骤,将面向文件的数据转换为更清晰,基于行的格式,更适合MapReduce.)

我不介意我有多少输出文件,但每个Map的输出最多只能有一个输出文件,每个输出文件必须排序.

如果我使用numReducers = 0运行,它会快速运行,并且每个Mapper写出自己的输出文件,这很好 - 但文件没有排序.

如果我添加一个reducer(plain Reducer.class),这会为单个文件添加一个不必要的全局排序步骤,这需要花费很多时间(比Map任务花费的时间长得多).

如果我添加多个reducer,则各个map作业的结果会混合在一起,因此一个Map的输出最终会出现在多个文件中.

有没有办法说服Hadoop对每个作业的输出执行地图侧排序,而不使用Reducers,或任何其他方式来跳过缓慢的全局合并？

推荐阅读

程序员
推送intel-xdk文件后,Pixi.js触摸事件没有在iPhone上触发

如何解决《推送intel-xdk文件后,Pixi.js触摸事件没有在iPhone上触发》经验，为你挑选了0个好方法。 ... [详细]
程序员
这种类型有一个构造函数,必须在这里初始化--Kotlin

如何解决《这种类型有一个构造函数,必须在这里初始化--Kotlin》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何使用python-tesseract获取Hocr输出

如何解决《如何使用python-tesseract获取Hocr输出》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么我得到远程:sh:2:语法错误:当我运行git push heroku master时,未终止引用的字符串

如何解决《为什么我得到远程:sh:2:语法错误:当我运行gitpushherokumaster时,未终止引用的字符串》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用java在base -2中创建二进制数组

如何解决《使用java在base-2中创建二进制数组》经验，为你挑选了1个好方法。 ... [详细]
程序员
将波特率设置为esp8266为9600

如何解决《将波特率设置为esp8266为9600》经验，为你挑选了1个好方法。 ... [详细]
程序员
找不到Digest/MD5.pm directadmin

如何解决《找不到Digest/MD5.pmdirectadmin》经验，为你挑选了1个好方法。 ... [详细]
程序员
绘制Pandas Multiindex条形图

如何解决《绘制PandasMultiindex条形图》经验，为你挑选了1个好方法。 ... [详细]
程序员
解释替代PHP For循环语法:for($ i = 1,$ j = 0; $ i <= 10; $ j + = $ i,print $ i,$ i ++);

如何解决《解释替代PHPFor循环语法:for($i=1,$j=0;$i<=10;$j+=$i,print$i,$i++);》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在外部缓存目录中为文件设置FileProvider

如何解决《如何在外部缓存目录中为文件设置FileProvider》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何验证Materialize下拉列表的选择选项？

如何解决《如何验证Materialize下拉列表的选择选项？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何防止记录pyspark的“已收到答复”和“发送命令”消息

如何解决《如何防止记录pyspark的“已收到答复”和“发送命令”消息》经验，为你挑选了0个好方法。 ... [详细]
程序员
尾递归映射f#

如何解决《尾递归映射f#》经验，为你挑选了1个好方法。 ... [详细]
程序员
MySQL Workbench导入限制

如何解决《MySQLWorkbench导入限制》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Windows上的PHP7安装中找不到mysqli类

如何解决《在Windows上的PHP7安装中找不到mysqli类》经验，为你挑选了1个好方法。 ... [详细]
程序员
v-for中的计算/动态v模型名称

如何解决《v-for中的计算/动态v模型名称》经验，为你挑选了1个好方法。 ... [详细]
程序员
在嵌套的MongoDB调用中,如何确保原子性？

如何解决《在嵌套的MongoDB调用中,如何确保原子性？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Intellij - 是否存在for循环类型的自动完成？

如何解决《Intellij-是否存在for循环类型的自动完成？》经验，为你挑选了2个好方法。 ... [详细]
程序员
反向for循环在Postgresql中不起作用

如何解决《反向for循环在Postgresql中不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
Xamarin表单ListView CachingStrategy

如何解决《Xamarin表单ListViewCachingStrategy》经验，为你挑选了0个好方法。 ... [详细]

mobiledu2402852357

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章