当前位置:  开发笔记 > 大数据 > 正文

GlusterFS或Ceph作为Hadoop的后端

如何解决《GlusterFS或Ceph作为Hadoop的后端》经验,为你挑选了1个好方法。

有没有人试图使用GlusterFS或Ceph作为Hadoop的后端?我不是在谈论只是使用插件来缝制东西.性能是否优于HDFS本身?是否适合生产使用.

另外,合并对象存储,hadoop hdfs存储作为单个存储是一个非常好的主意吗?或者最好让它们分开.



1> 小智..:

我之前使用过GlusterFS,它有一些很好的功能,但最后我选择在Hadoop中使用HDFS用于分布式文件系统.

关于GlusterFS的好处是它不需要主客户端节点.集群中的每个节点都是相同的,因此GlusterFS中没有单点故障.我在GlusterFS中发现一件有趣的事情是,当你想存储一个文件时,它有glusterfs-client模块,http://www.jamescoyle.net/how-to/439-mount-a-glusterfs-volume对于glusterfs,你不需要与GlusterFS apis接口,你只需要将文件复制到glusterfs-client中的已安装卷中,并使工作变得如此简单.

但我发现GlusterFS很难集成到Hadoop生态系统,如Spark,Mapreduce等,其中HDFS受Hadoop生态系统中所有大多数组件的支持.我认为GlusterFS很适合构建一个独立于Hadoop的文件存储等集群系统.

推荐阅读
雯颜哥_135
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有