第一次在这里Map/Reduce用户,并使用MongoDB.我有很多页面访问数据,我想通过使用Map/Reduce来了解一些.下面基本上是我想要做的,但作为一个初学者Map/Reduce,我认为这超出了我的知识!
在过去30天内浏览所有访问过的页面,其中external = true.
然后为每个页面找到所有访问
通过推荐位置对所有访问进行分组
对于每个推荐位置,计算访问具有特定"类型"并且在"标签"中具有特定单词的页面的数量.
数据库和集合组织为
$mongo->dbname->visits
示例文档是:
{"url": "www.example.com", "type": "a", "refer": {"external": true, "domain": "twitter.com", "url": "http://www.twitter.com/page"}, "page": "1235", "user": "1232", "time": 1234567890}
然后我想找到带有特定标签的B类文件.
{"url": "www.example.com", "type": "b", "page": "745", "user": "1232", "time": 1234567890, "tags": {"a", "b", "c"}}
我正在使用正常的Mongo PHP扩展,如果它有影响.
好吧,我想出了一些我认为可以做你想做的事情.请注意,这可能无法正常工作,因为我不是100%确定您的架构(考虑到您的示例显示refer
在类型a中,但不是b(我不确定这是否是遗漏,或者考虑您要查看的内容)通过referer)...无论如何,这是我想出的:
地图功能:
function() { var obj = { "types": {}, "tags": {}, } obj.types[this.type] = 1; if (this.tags) { for (var tag in this.tags) { obj.tags[this.tags[tag]] = 1; } } emit(this.refer.url, obj); }
减少功能:
function(key, values) { var obj = { "types": {}, "tags": {}, } for (var i = 0; i < values.length; i++) { for (var type in values[i].types) { if (!type in obj.types) { obj.types[type] = 0; } obj.types[type] += values[i].types[type]; } for (var tag in values[i].tags) { if (!tag in obj.tags) { obj.tags[tag] = 0; } obj.tags[tag] += values[i].tags[tag]; } } return obj; }
所以基本上,它是如何工作的.Map函数使用refer.url的键(我根据您的描述猜测).因此,最终结果看起来像一个_id
等于refer.url 的数组(它基于url进行分组).然后它创建一个对象,其下有两个对象(类型和标签).对象的原因是map和reduce可以发出相同的格式对象.除此之外,我认为它应该是相对自我解释的(如果你不明白,我可以尝试解释更多)...
所以让我们在PHP中实现它(假设$map
并且$reduce
是包含上面的字符串的字符串):
$mapFunc = new MongoCode($map); $reduceFunc = new MongoCode($reduce); $query = array( 'time' => array('$gte' => time() - (60*60*60*24*30)), 'refer.external' => true ); $collection = 'visits'; $command = array( 'mapreduce' => $collection, 'map' => $mapFunc, 'reduce' => $reduceFunc, 'query' => $query, ); $statsInfo = $db->command($command); $statsCollection = $db->selectCollection($sales['result']); $stats = $statsCollection->find(); foreach ($stats as $stat) { echo $stats['_id'] .' Visited '; foreach ($stats['value']['types'] as $type => $times) { echo "Type $type $times Times, "; } foreach ($stats['value']['tags'] as $tag => $times) { echo "Tag $tag $times Times, "; } echo "\n"; }
注意,我没有测试过这个.根据我对你的模式的理解,以及我对Mongo及其Map-Reduce实现的理解,这就是我所提出的......