MongoDB中使用MapReduce进行分组统计

作者：地之南_816 | 2021-09-10 00:23

MongoDB中使用MapReduce进行分组统计最近在统计某一个时间段的url去重数，由于数据量巨大导致报错，提示：distinctfailed:{

MongoDB中使用MapReduce进行分组统计最近在统计某一个时间段的url去重数，由于数据量巨大导致报错，提示： distinct failed: {

最近在统计某一个时间段的url去重数，，由于数据量巨大导致报错，提示：

distinct failed: {

"errmsg" : "exception: distinct too big, 16mb cap",

"code" : 17217,

"ok" : 0

} at src/mongo/shell/collection.js:1108

经过查阅资料，最终通过mapreduce来解决如下：

//定义map函数

map=function(){

emit(this.url,{"count":1});

}

//定义reduce函数

reduce=function(key,values){

var total=0;

for(var i=0; i < values.length; i++){

total+=values[i].count;

}

return {count:total}

}

//执行mapreduce函数,其中out的值是存储执行结果的集合

db.runCommand({"mapreduce":"visit","map":map,"reduce":reduce,"query":{"vtime":{"$gte":1412611200,"$lte":1413907119}},"out":"test.tmp"});

CentOS编译安装MongoDB

CentOS 编译安装 MongoDB与mongoDB的php扩展

CentOS 6 使用 yum 安装MongoDB及服务器端配置

Ubuntu 13.04下安装MongoDB2.4.3

MongoDB入门必读(概念与实战并重)

Ubunu 14.04下MongoDB的安装指南

《MongoDB 权威指南》(MongoDB: The Definitive Guide)英文文字版[PDF]

Nagios监控MongoDB分片集群服务实战

基于CentOS 6.5操作系统搭建MongoDB服务

MongoDB 的详细介绍：请点这里
MongoDB 的下载地址：请点这里

推荐阅读

程序员
用Lodash省略嵌套属性

如何解决《用Lodash省略嵌套属性》经验，为你挑选了2个好方法。 ... [详细]
程序员
即使状态已更改,成功的调度也不会导致重新渲染

如何解决《即使状态已更改,成功的调度也不会导致重新渲染》经验，为你挑选了1个好方法。 ... [详细]
程序员
从Executor等待Future:Future不能用于'await'表达式

如何解决《从Executor等待Future:Future不能用于'await'表达式》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何开始使用QtLinguist翻译我的QtCreator项目？

如何解决《如何开始使用QtLinguist翻译我的QtCreator项目？》经验，为你挑选了1个好方法。 ... [详细]
程序员
委托:Angular中的EventEmitter或Observable

如何解决《委托:Angular中的EventEmitter或Observable》经验，为你挑选了2个好方法。 ... [详细]
程序员
Pandas DataFrames:如何包装没有空格的文本

如何解决《PandasDataFrames:如何包装没有空格的文本》经验，为你挑选了1个好方法。 ... [详细]
程序员
| vs || ......我使用哪一个是否重要？

如何解决《|vs||我使用哪一个是否重要？》经验，为你挑选了2个好方法。 ... [详细]
程序员
字符串与Java中的长性能

如何解决《字符串与Java中的长性能》经验，为你挑选了1个好方法。 ... [详细]
程序员
针对统一调用语法的C++ 17提议如何处理名称空间？

如何解决《针对统一调用语法的C++17提议如何处理名称空间？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何验证每个用户可以使用OAuth和OpenID Connect访问哪些资源？

如何解决《如何验证每个用户可以使用OAuth和OpenIDConnect访问哪些资源？》经验，为你挑选了1个好方法。 ... [详细]
程序员
{before _,} {install,script} .travis.yml选项之间有什么区别？

如何解决《{before_,}{install,script}.travis.yml选项之间有什么区别？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如果元素在数组中出现三次以上,则返回布尔值

如何解决《如果元素在数组中出现三次以上,则返回布尔值》经验，为你挑选了3个好方法。 ... [详细]
程序员
为什么LINQ查询后的GC释放WhereListIterator而不是表示条件的Func？

如何解决《为什么LINQ查询后的GC释放WhereListIterator而不是表示条件的Func？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Clojure中,如何正确更新嵌套映射？

如何解决《在Clojure中,如何正确更新嵌套映射？》经验，为你挑选了0个好方法。 ... [详细]
程序员
有没有办法在PHP中创建一个匿名对象

如何解决《有没有办法在PHP中创建一个匿名对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
突变多个/连续列(使用dplyr或base R)

如何解决《突变多个/连续列(使用dplyr或baseR)》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在左侧按钮上创建一个带有文本的JButton,并在右侧按钮上将图标与其分开

如何解决《如何在左侧按钮上创建一个带有文本的JButton,并在右侧按钮上将图标与其分开》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何创建Gulp任务以正确地进行缩小和源映射到.min文件

如何解决《如何创建Gulp任务以正确地进行缩小和源映射到.min文件》经验，为你挑选了0个好方法。 ... [详细]
程序员
反应原生内存泄漏动画问题

如何解决《反应原生内存泄漏动画问题》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在UWP中创建MapIcon事件？

如何解决《如何在UWP中创建MapIcon事件？》经验，为你挑选了1个好方法。 ... [详细]

地之南_816

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章