当前位置:  开发笔记 > 大数据 > 正文

Hadoop MR源:HDFS与HBase.每个的好处?

如何解决《HadoopMR源:HDFS与HBase.每个的好处?》经验,为你挑选了1个好方法。

如果我正确理解Hadoop生态系统,我可以运行我的MapReduce作业从HDFS或HBase获取数据.假设先前的假设是正确的,为什么我会选择一个而不是另一个?使用HBase作为MR源,是否具有性能,可靠性,成本或易用性的优势?

我能找到的最好的是这句话,"HBase是当你需要对非常大的数据集进行实时读/写随机访问时使用的Hadoop应用程序." - Tom White(2009)Hadoop:The Definitive Guide,1st Edition



1> bajafresh4li..:

使用直接Hadoop Map/Reduce over HDFS,您的输入和输出通常存储为平面文本文件或Hadoop SequenceFiles,它们只是流式传输到磁盘的序列化对象.这些数据存储或多或少是不可变的.这使得Hadoop适用于批处理任务.

HBase是一个使用HDFS作为存储的完整数据库(尽管不是关系型的).这意味着您可以对数据集运行交互式查询和更新.

HBase的优点在于它可以很好地与Hadoop生态系统配合使用,因此如果您需要对大型数据集执行批处理以及交互式,精细化,记录级操作,HBase将做得很好.

推荐阅读
依然-狠幸福
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有