Hadoop 0.2:如何从TextOutputFormat读取输出？

作者：有风吹过best | 2023-07-16 13:02

如何解决《Hadoop0.2:如何从TextOutputFormat读取输出？》经验，为你挑选了1个好方法。

我的reducer类使用TextOutputFormat(Job提供的默认OutputFormat)生成输出.我想在MapReduce作业完成后使用此输出来聚合输出.除此之外,我喜欢用TextInputFormat写出聚合信息,以便下一次MapReduce任务迭代可以消耗此过程的输出.谁能给我一个关于如何用TextFormat写和读的例子？顺便说一下,我使用TextFormat而不是Sequence的原因是互操作性.输出应由任何软件使用.

1> Bkkbrad..：

暂时不排除序列文件; 它们可以快速轻松地链接MapReduce作业,您可以使用"hadoop fs -text filename "以文本格式输出它们,如果您需要它们用于其他方式.

但是,回到原来的问题:使用TextInputFormat,将其设置为Job中的输入格式,然后用于TextInputFormat.setInputPaths指定它应该用作输入的文件.映射器的关键应该是LongWritable,值为Text.

要将TextOutputFormat用作输出,请将其设置为作业中的输出格式,然后使用TextOuputFormat.setOutputPath它指定输出路径.你的减速(或映射器,如果它是一个地图,唯一的工作)需要使用NullWritable作为输出密钥的类型得到公正的价值观每行一个,或以其他方式每行的文本表示将是关键的文本表示和由制表符分隔的值(默认情况下,您可以通过将" mapred.textoutputformat.separator" 设置为其他分隔符来更改此值).

推荐阅读

程序员
C++如何以有序的方式读取和存储100个char 2D数组[500] [500]？

如何解决《C++如何以有序的方式读取和存储100个char2D数组[500][500]？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Python将一个变量中的多个列表合并为一个列表

如何解决《Python将一个变量中的多个列表合并为一个列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
导入FlatMap实例中断应用程序构建器语法

如何解决《导入FlatMap实例中断应用程序构建器语法》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何找到内置Python方法的源代码的位置？

如何解决《如何找到内置Python方法的源代码的位置？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Spring为未定义的bean抛出异常

如何解决《Spring为未定义的bean抛出异常》经验，为你挑选了0个好方法。 ... [详细]
程序员
502错误的网关-Django + Nginx + Gunicorn-袜子失败（13：权限被拒绝）

如何解决《502错误的网关-Django+Nginx+Gunicorn-袜子失败（13：权限被拒绝）》经验，为你挑选了0个好方法。 ... [详细]
程序员
Matplotlib创建实时动画图形

如何解决《Matplotlib创建实时动画图形》经验，为你挑选了1个好方法。 ... [详细]
程序员
iOS版.使用USB麦克风录制96kHz

如何解决《iOS版.使用USB麦克风录制96kHz》经验，为你挑选了0个好方法。 ... [详细]
程序员
用Lodash省略嵌套属性

如何解决《用Lodash省略嵌套属性》经验，为你挑选了2个好方法。 ... [详细]
程序员
即使状态已更改,成功的调度也不会导致重新渲染

如何解决《即使状态已更改,成功的调度也不会导致重新渲染》经验，为你挑选了1个好方法。 ... [详细]
程序员
从Executor等待Future:Future不能用于'await'表达式

如何解决《从Executor等待Future:Future不能用于'await'表达式》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何开始使用QtLinguist翻译我的QtCreator项目？

如何解决《如何开始使用QtLinguist翻译我的QtCreator项目？》经验，为你挑选了1个好方法。 ... [详细]
程序员
委托:Angular中的EventEmitter或Observable

如何解决《委托:Angular中的EventEmitter或Observable》经验，为你挑选了2个好方法。 ... [详细]
程序员
Pandas DataFrames:如何包装没有空格的文本

如何解决《PandasDataFrames:如何包装没有空格的文本》经验，为你挑选了1个好方法。 ... [详细]
程序员
| vs || ......我使用哪一个是否重要？

如何解决《|vs||我使用哪一个是否重要？》经验，为你挑选了2个好方法。 ... [详细]
程序员
字符串与Java中的长性能

如何解决《字符串与Java中的长性能》经验，为你挑选了1个好方法。 ... [详细]
程序员
针对统一调用语法的C++ 17提议如何处理名称空间？

如何解决《针对统一调用语法的C++17提议如何处理名称空间？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何验证每个用户可以使用OAuth和OpenID Connect访问哪些资源？

如何解决《如何验证每个用户可以使用OAuth和OpenIDConnect访问哪些资源？》经验，为你挑选了1个好方法。 ... [详细]
程序员
{before _,} {install,script} .travis.yml选项之间有什么区别？

如何解决《{before_,}{install,script}.travis.yml选项之间有什么区别？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如果元素在数组中出现三次以上,则返回布尔值

如何解决《如果元素在数组中出现三次以上,则返回布尔值》经验，为你挑选了3个好方法。 ... [详细]

有风吹过best

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章