是否有理论分析可以解释mapreduce可以解决哪些问题?
在用于多核机器学习的Map-Reduce中, Chu 等人描述了"适合统计查询模型的算法可以用某种"求和形式编写,这使得它们可以在多核计算机上轻松并行化." 他们使用map-reduce框架专门实现了10种算法,包括加权线性回归,k-Means,Naive Bayes和SVM.
该阿帕奇亨利马乌项目已经发布了Hadoop的近期(Java)的实现的基础上,从本文的观点的一些方法.
对于需要处理和生成大型数据集的问题.假设对银行持有的所有账户运行利息生成查询.假设处理过去一年在银行中发生的所有交易的审计数据.最好的用例来自谷歌 - 为谷歌搜索引擎生成搜索索引.
许多"令人尴尬的并行"问题(很棒的短语!)都可以使用MapReduce.http://en.wikipedia.org/wiki/Embarrassingly_parallel
从这篇文章.... http://www.businessweek.com/magazine/content/07_52/b4064048925836.htm ...
Hadoop(MapReduce的一个开源实现)的创始人Doug Cutting说......"Facebook使用Hadoop来分析用户行为以及网站上广告的有效性"
并且......"纽约时报的技术团队在亚马逊的云上租用计算能力,并使用Hadoop将可追溯到1851年的1100万份存档文章转换成数字和可搜索的文档.他们在一天之内就转过身去做一个本来需要几个月的工作."