3赞

在Hadoop Streaming中生成单独的输出文件

作者：小色米虫_524 | 2023-08-16 20:33

如何解决《在HadoopStreaming中生成单独的输出文件》经验，为你挑选了1个好方法。

仅使用映射器(Python脚本)而不使用reducer,如何为每行输出输出一个单独的文件作为文件名,而不是输出长文件？

1> Erik Forsber..：

可以使用-inputformat和-outputformat命令行参数替换input和outputformat类.

可以在dumbo项目中找到如何执行此操作的一个示例,该项目是用于编写流式作业的python框架.它有写入多个文件的功能,并在内部它与它的姊妹项目,一类替代输出格式羽毛 - fm.last.feathers.output.MultipleTextFiles.

然后reducer需要发出一个元组作为键,元组的第一个组件是指向应该写入带有键/值对的文件的目录的路径.可能仍有多个文件,这取决于reducer和应用程序的数量.

我建议查看dumbo,它有许多功能,可以更容易在python中的Hadoop上编写Map/Reduce程序.

推荐阅读

程序员
在Python中使用.NET dll

如何解决《在Python中使用.NETdll》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android中阿拉伯文字的阿拉伯数字

如何解决《Android中阿拉伯文字的阿拉伯数字》经验，为你挑选了2个好方法。 ... [详细]
程序员
泛洪的最合适的HTTP状态代码是什么？

如何解决《泛洪的最合适的HTTP状态代码是什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用数组计算每个数字的出现次数

如何解决《使用数组计算每个数字的出现次数》经验，为你挑选了0个好方法。 ... [详细]
程序员
选择一个RadioButton值并向后滚动以删除RecyclerView中的选定值

如何解决《选择一个RadioButton值并向后滚动以删除RecyclerView中的选定值》经验，为你挑选了0个好方法。 ... [详细]
程序员
从包的__init__.py中屏蔽python子模块

如何解决《从包的__init__.py中屏蔽python子模块》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用反射填充自定义类属性

如何解决《使用反射填充自定义类属性》经验，为你挑选了1个好方法。 ... [详细]
程序员
查找列表中邻居的最有效方法

如何解决《查找列表中邻居的最有效方法》经验，为你挑选了0个好方法。 ... [详细]
程序员
无法保持jQuery下拉列表滑落

如何解决《无法保持jQuery下拉列表滑落》经验，为你挑选了0个好方法。 ... [详细]
程序员
证明父母留下的div

如何解决《证明父母留下的div》经验，为你挑选了0个好方法。 ... [详细]
程序员
WPF PRISM 6 DelegateComand ObservesCanExecute

如何解决《WPFPRISM6DelegateComandObservesCanExecute》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用C++包装库的C#性能

如何解决《使用C++包装库的C#性能》经验，为你挑选了1个好方法。 ... [详细]
程序员
在R中按计数合并数据帧

如何解决《在R中按计数合并数据帧》经验，为你挑选了1个好方法。 ... [详细]
程序员
__uuidof（someVar）是做什么的？

如何解决《__uuidof（someVar）是做什么的？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用MATLAB将信号发送到IP地址的端口？

如何解决《如何使用MATLAB将信号发送到IP地址的端口？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何从新行设置数组的每个元素

如何解决《如何从新行设置数组的每个元素》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在代码优先迁移中强制删除并重新创建选定的表？

如何解决《如何在代码优先迁移中强制删除并重新创建选定的表？》经验，为你挑选了1个好方法。 ... [详细]
程序员
尝试执行迁移时模型的未处理挂起操作

如何解决《尝试执行迁移时模型的未处理挂起操作》经验，为你挑选了0个好方法。 ... [详细]
程序员
Xcode命令行测试执行问题

如何解决《Xcode命令行测试执行问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
将字符串拆分为数组并修剪每个值的有效方法 - Swift

如何解决《将字符串拆分为数组并修剪每个值的有效方法-Swift》经验，为你挑选了1个好方法。 ... [详细]

小色米虫_524

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章