*基本上我试图通过他们在过去一小时的分数来订购物品.
我正在尝试为我的数据库中的对象生成每小时的投票金额.投票嵌入到每个对象中.对象模式如下所示:
{ _id: ObjectId score: int hourly-score: int <- need to update this value so I can order by it recently-voted: boolean votes: { "4e4634821dff6f103c040000": { <- Key is __toString of voter ObjectId "_id": ObjectId("4e4634821dff6f103c040000"), <- Voter ObjectId "a": 1, <- Vote amount "ca": ISODate("2011-08-16T00:01:34.975Z"), <- Created at MongoDate "ts": 1313452894 <- Created at timestamp }, ... repeat ... } }
这个问题实际上与我几天前提出的一个问题有关.在MongoDB中建模投票系统的最佳方法
我(我可以吗?)运行MapReduce命令来执行以下操作:
仅在最近投票=真或小时分数> 0的对象上运行.
计算过去一小时内创建的投票总和.
更新每小时得分=上面计算的总和,最近投票=假.
我还在这里读到,我可以通过在M/R命令之前运行db.getMongo().setSlaveOk()来在从属DB上执行MapReduce.我可以在slave上运行reduce并更新主DB吗?
Mongo MapReduce甚至可以进行就地更新吗?
你绝对可以做到这一点.我会一次一个地解决你的问题:
1.您可以指定一个查询以及map-reduce,它会过滤将传递到地图阶段的对象集.在mongo shell中,这看起来像(假设m
并且r
分别是mapper和reducer函数的名称):
> db.coll.mapReduce(m, r, {query: {$or: [{"recently-voted": true}, {"hourly-score": {$gt: 0}}]}})
2.步骤#1将允许您在最后一小时内至少投票一次的所有文档上使用您的映射器(或recently-voted
设置为true),但并非所有投票都在最后一小时.因此,您需要过滤映射器中的列表,并仅发出您希望计算的投票数:
function m() { var hour_ago = new Date() - 3600000; this.votes.forEach(function (vote) { if (vote.ts > hour_ago) { emit(/* your key */, this.vote.a); } }); }
并减少:
function r(key, values) { var sum = 0; values.forEach(function(value) { sum += value; }); return sum; }
3.要更新每小时得分表,您可以使用reduceOutput
map-reduce选项,它将使用发出的值和输出集合中先前保存的值(如果有)调用您的reducer.该传递的结果将保存到输出集合中.这看起来像:
> db.coll.mapReduce(m, r, {query: ..., out: {reduce: "output_coll"}})
除了重新减少输出之外,您还可以使用merge
哪个将使用新创建的文档覆盖输出集合中的文档(但留下与您的mr作业创建的文档_id
不同的任何文档_id
)replace
,这实际上是一个drop-and -create operation是默认值,或者是use {inline: 1}
,它会将结果直接返回给shell或驱动程序.请注意,使用时{inline: 1}
,结果必须符合单个文档允许的大小(最近的MongoDB版本中为16MB).
(4.)您可以在辅助节点("从节点")上运行map-reduce作业,但由于辅助节点不能接受写入(这使它们成为辅助节点),因此只能在使用内联输出时执行此操作.