当前位置:  开发笔记 > 编程语言 > 正文

如何使用Cassandra的Map Reduce或者没有Pig?

如何解决《如何使用Cassandra的MapReduce或者没有Pig?》经验,为你挑选了1个好方法。

有人可以解释MapReduce如何与Cassandra一起使用.6?我已经阅读了单词计数示例,但我并不完全了解Cassandra结束与"客户端"结束时发生的事情.

https://svn.apache.org/repos/asf/cassandra/trunk/contrib/word_count/

例如,假设我使用的是Python和Pycassa,我将如何加载新的map reduce函数,然后调用它?我的map reduce函数必须是安装在cassandra服务器上的java吗?如果是这样,我如何从Pycassa调用它?

还有提到猪使这一切变得更容易,但我是一个完整的Hadoop菜鸟,所以这并没有真正的帮助.

你的回答可以使用Thrift或者其他什么,我刚才提到Pycassa来表示客户端.我只是想了解Cassandra集群中运行的内容与发出请求的实际服务器之间的区别.



1> Chris Bunch..:

从我所听到的(以及从这里)开发人员编写使用Cassandra作为数据源的MapReduce程序的方式如下.您编写了一个常规MapReduce程序(您链接到的示例是针对纯Java版本),现在可用的jar提供了一个CustomInputFormat,它允许输入源为Cassandra(而不是默认值,即Hadoop).

如果你正在使用Pycassa我会说你运气不好(1)该项目的维护者增加了对MapReduce的支持,或者(2)你将一些Python函数放在一起编写一个Java MapReduce程序并运行它.后者肯定是一个黑客,但会让你起来.


它仍然是分布式的,只是分布在系统中的Hadoop节点上.Cassandra接口的主要观点是,之前有些人这样做的方式是转储他们的Cassandra数据库的一个子集,然后读入它,运行MR作业,然后将其转储回Cassandra.这删除了一些样板代码(主要是).
推荐阅读
虎仔球妈_459
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有