我正在寻找一些关于其他人如何使用Hadoop或其他MapReduce技术的一般信息.总的来说,我很想知道您是在编写MR应用程序来处理现有数据集(如Web服务器日志文件),还是在编写生成和处理新数据集的应用程序?
编辑: 后续问题
(1)您是否曾对其他MR程序生成的数据执行MR程序?
(2)您是否需要使用MR修改现有数据集?
(3)您是否曾与其他开发人员共享您的数据集?
查看PowerdBy Hadoop wiki,了解从Facebook到FOX News的所有内容以及他们如何使用它.