当前位置:  开发笔记 > 大数据 > 正文

Hadoop mapreduce编程

如何解决《Hadoopmapreduce编程》经验,为你挑选了1个好方法。

如何使用Hadoop mapreduce编程获取排序的o/p.

有没有办法按排序顺序获得最终的键值对.(按键或值).

任何关于此的指针都非常感激.

谢谢你



1> azec-pdx..:

默认情况下,MapReduce将按键对输入记录进行排序.

但是,它可能会帮助您更多地下载最新的Hadoop版本并查看它们的示例.还有不同的排序示例.

如果您需要有关排序顺序的更多信息,可以通过以下方式进行更改.

键的排序顺序由RawComparator控制,如下所示:

    如果设置了属性mapred.output.key.comparator.class,则使用该类的实例.(JobConf上的setOutputKeyComparatorClass()方法是设置此属性的便捷方法.)

    否则,键必须是WritableComparable的子类,并使用键类的已注册比较器.

    如果没有已注册的比较器,则使用RawComparator,将要比较的字节流反序列化为对象,并委托给WritableCompar的compareTo()方法.这些规则强调了为您自己的自定义Writable类注册优化版本的RawCompara tors的重要性,以及通过设置自己的比较器来直接覆盖排序顺序.

推荐阅读
360691894_8a5c48
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有