对于在自己的集群上部署了HBase的人来说,你觉得它对于生产使用来说足够稳定吗?你遇到了哪些类型的麻烦或问题?
我确实看到许多公司在生产中使用HBase(http://wiki.apache.org/hadoop/Hbase/PoweredBy),但我很好奇是否需要进行大量的维护,修补和烧毁.保持HBase群集正常运行.
HBase即将达到HBase-0.20的重要里程碑.有一个阿尔法,很快就会成为一名RC.它已经有了非常重要的性能改进.据报道,StumbleUpon正在为HBase的主干版本提供现场服务,没有其他缓存层.所以我说它绝对可以用于生产.
Ryan Rawson(StumbleUpon)最近在nosql会议上发表了一篇很好的演讲,主要是关于它在过去的6个月中走了多远.如果你不想看整件事,有幻灯片.除了性能改进之外,另一个主要的补充是它现在与zookeeper集成,因此主人不再是单点故障.
由于文件格式的限制,HBase曾因内存小问题而出现小小区大小的问题.使用新的自定义文件格式也解决了这个问题,这也提高了性能.
我已经用HBase进行了大约一年的实验,我已经准备好用生产服务来信任0.20了,我不太喜欢旧版本.我在实验时建议至少使用4或5个节点的decluster.
我无法评论生产集群的关注点,因为我们只是从生产集群开始.一个有帮助的方面是邮件列表非常活跃,并且irc一直在使用,所以至少有一个非常强大的社区帮助.