使用Hadoop,我的Reducer是否可以保证使用相同的密钥获取所有记录？

作者：拾味湖 | 2023-07-15 23:12

如何解决《使用Hadoop,我的Reducer是否可以保证使用相同的密钥获取所有记录？》经验，为你挑选了2个好方法。

我正在使用Hive运行Hadoop作业实际上应该uniq在许多文本文件中排队.在reduce步骤中,它为每个键选择最近时间戳记录.

Hadoop是否保证具有相同键的每个记录(通过映射步骤输出)将转到单个reducer,即使在群集中运行了许多Reducer？

我担心在具有相同密钥的一组记录中间发生shuffle后,mapper输出可能会被拆分.

1> Karl Anderso..：

密钥的所有值都将发送到同一个reducer.看到这个Yahoo! 教程进行更多讨论.

此行为由分区程序确定,如果使用默认分区程序以外的分区程序,则可能不是这样.

2> Bkkbrad..：

实际上,不!您可以创建一个Partitioner在每次getPartition调用时将相同的密钥发送到不同的reducer .对于大多数应用程序来说,这通常不是一个好主意.

推荐阅读

程序员
XAML Designer - 默认缩放？

如何解决《XAMLDesigner-默认缩放？》经验，为你挑选了1个好方法。 ... [详细]
程序员
代码中的奇怪行为,用于测试线程安全的单例

如何解决《代码中的奇怪行为,用于测试线程安全的单例》经验，为你挑选了2个好方法。 ... [详细]
程序员
React Native:如何更改状态栏图标颜色

如何解决《ReactNative:如何更改状态栏图标颜色》经验，为你挑选了1个好方法。 ... [详细]
程序员
将快速结构暴露给ObjC

如何解决《将快速结构暴露给ObjC》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用组运算符时的时间假型而不是ISO8601

如何解决《使用组运算符时的时间假型而不是ISO8601》经验，为你挑选了0个好方法。 ... [详细]
程序员
Find()的Javascript代码优化

如何解决《Find()的Javascript代码优化》经验，为你挑选了0个好方法。 ... [详细]
程序员
矢量化代码时缓存未命中数增加

如何解决《矢量化代码时缓存未命中数增加》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在JavaFX的Textfield中添加提示文本

如何解决《如何在JavaFX的Textfield中添加提示文本》经验，为你挑选了1个好方法。 ... [详细]
程序员
哪个版本的Windows支持/需要哪些CPU多媒体扩展？

如何解决《哪个版本的Windows支持/需要哪些CPU多媒体扩展？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java:如何调用主类中的方法,该方法在另一个扩展抽象类的类中

如何解决《Java:如何调用主类中的方法,该方法在另一个扩展抽象类的类中》经验，为你挑选了1个好方法。 ... [详细]
程序员
大纲文字Android Studio

如何解决《大纲文字AndroidStudio》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用数组作为索引增加numpy数组元素

如何解决《使用数组作为索引增加numpy数组元素》经验，为你挑选了1个好方法。 ... [详细]
程序员
线程安全事件 - 这是一种"干净"的方式吗？

如何解决《线程安全事件-这是一种"干净"的方式吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
DDD-使用Doctrine 2的有界上下文之间的关联映射

如何解决《DDD-使用Doctrine2的有界上下文之间的关联映射》经验，为你挑选了1个好方法。 ... [详细]
程序员
FirefoxDriver始终在"firstrun"页面上启动,打破所有测试脚本

如何解决《FirefoxDriver始终在"firstrun"页面上启动,打破所有测试脚本》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Spark DataFrames查询JSON数据列？

如何解决《如何使用SparkDataFrames查询JSON数据列？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在断开事件中重新连接套接字

如何解决《在断开事件中重新连接套接字》经验，为你挑选了1个好方法。 ... [详细]
程序员
更新Liferay用户锁定

如何解决《更新Liferay用户锁定》经验，为你挑选了1个好方法。 ... [详细]
程序员
Linux内核 - "放置"inode是什么意思？

如何解决《Linux内核-"放置"inode是什么意思？》经验，为你挑选了1个好方法。 ... [详细]
程序员
尝试从命令行获取星号*作为main的输入

如何解决《尝试从命令行获取星号*作为main的输入》经验，为你挑选了2个好方法。 ... [详细]

拾味湖

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章