当前位置:  开发笔记 > 编程语言 > 正文

文档数据库:冗余数据,引用等(MongoDB专门)

如何解决《文档数据库:冗余数据,引用等(MongoDB专门)》经验,为你挑选了2个好方法。

似乎我遇到了许多情况,其中构建我的数据的适当方法是将其拆分为两个文档.让我们说这是一个连锁商店,你节省了每个客户访问过的商店.商店和客户需要是独立的数据,因为它们与许多其他东西相互作用,但我们需要将它们联系起来.

因此,简单的答案是将用户的Id存储在商店文档中,或将商店的Id存储在用户的文档中.但很多时候,您希望访问1-2个其他数据用于显示目的,因为Id无用.可能是客户名称或商店名称.

    您通常存储整个文档的副本吗?或者只是存储您需要的数据?可能取决于文档的大小与您需要的大小.

    你如何处理你有重复数据的事实?当数据发生变化时,你会去搜索数据吗?加载后的某个时间间隔更新数据?只有在您能负担得起陈旧数据时才重复?

非常感谢您的意见和/或任何类型的"最佳实践"或至少有充分理由讨论这些主题的链接.



1> Niels van de..:

基本上有两个场景:新鲜陈旧.

新鲜数据

存储重复数据很容易.维护重复数据是困难的部分.因此,最简单的方法是避免维护,只需不要存储任何重复数据.如果您需要新数据,这主要是有用的.仅存储引用,并在需要检索信息时查询集合.

在这种情况下,由于额外的查询,您将有一些开销.另一种方法是跟踪重复数据的所有位置,并更新每次更新的所有实例.这也涉及开销,特别是在您提到的N-to-M关系中.无论哪种方式,如果您需要新数据,都会有一些开销.你不可能拥有两全其美的优势.

陈旧数据

如果您能负担得起陈旧数据,事情会变得容易多了.为避免查询开销,您可以存储重复数据.为避免必须维护重复数据,您不会存储重复数据.至少不积极.

在这种情况下,您还希望仅存储文档之间的引用.然后使用周期性map-reduce作业生成重复数据.然后,您可以查询单个map-reduce结果,而不是单独的集合.这样可以避免查询开销,但您也不必寻找数据更改.

摘要

仅存储对其他文档的引用.如果您能负担过时的数据,请使用定期的map-reduce作业来生成重复数据.避免维护重复数据; 它很复杂且容易出错.



2> Gates VP..:

这里的答案实际上取决于您对数据的当前需求.

@Niels在这里有一个很好的总结,但我认为你可以"欺骗"是公平的.

假设您要显示用户使用的商店.这里显而易见的问题是你无法将商店"嵌入"用户b/c商店本身太重要了.但你可以做的是在用户中嵌入一些商店数据.

只需使用您想要显示的内容,如"商店名称".所以你的User对象看起来像这样:

{
  _id : MongoID(),
  name : "Testy Tester",
  stores : [ 
             { _id : MongoID(), "name" : 'Safeway' },
             { _id : MongoID(), "name" : 'Walmart' },
             { _id : MongoID(), "name" : 'Best Buy' }
            ]
}

这样您就可以显示典型的"网格"视图,但需要一个链接来获取有关商店的更多数据.


+1当定期生成关闭现有数据的数据时,这是一种很好的方法.如果手动插入额外数据,则还必须手动更新.当然,对于不太可能发生变化的事情,例如商店名称,这不是问题.
推荐阅读
无名有名我无名_593
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有