11赞

mongodb中的数据重复太多了？

作者：wurtjq | 2023-06-26 15:24

如何解决《mongodb中的数据重复太多了？》经验，为你挑选了1个好方法。

我是新手NOSQL的新手,最近对mongoDB很感兴趣.我正在从头开始创建一个新网站,并决定使用MONGODB/NORM(用于C#)作为我唯一的数据库.我一直在阅读很多关于如何正确设计文档模型数据库的内容,我认为在很大程度上我的设计运行得非常好.我大约6个月进入我的新网站,我开始看到我需要一遍又一遍地处理数据复制/同步的问题.从我读到的内容来看,这在文档模型中是可以预期的,并且对于性能而言是有意义的.IE将嵌入的对象粘贴到文档中,因此读取速度快 - 没有连接; 但是当然你不能总是嵌入,所以mongodb有这个DbReference的概念,它基本上类似于关系数据库中的外键.

所以这是一个例子:我有用户和事件; 两者都获得自己的文件,用户参加活动,活动有用户参加.我决定将有限数据的事件列表嵌入到User对象中.我还将用户列表嵌入到Event对象中作为"与会者".现在的问题是我必须使用户与同样嵌入在Event对象中的用户列表保持同步.正如我所读到的,这似乎是首选的方法,也是NOSQL做事的方式.检索很快,但回退是当我更新主用户文档时,我还需要进入Event对象,可能找到对该用户的所有引用并更新它.

所以我的问题是,这是人们需要处理的一个非常普遍的问题吗？在你开始说"可能NOSQL策略不适合我在这里尝试做的事情"之前,这个问题要发生多少？什么时候不必加入连接的性能优势变成了一个缺点,因为你很难在嵌入式对象中保持数据同步并对数据库执行多次读取操作？

1> Zac Bowling..：

那就是与文档商店的权衡.您可以像任何标准RDMS一样以标准化方式存储,并且您应该尽可能地争取规范化.只有在性能受到影响的情况下才能打破规范化并使数据结构变得扁平化.权衡取决于读取效率与更新成本.

Mongo具有非常高效的索引,可以像传统的RDMS一样使规范化变得更容易(大多数文档存储不会免费提供这个,这就是为什么Mongo更像是混合而不是纯文档存储).使用此功能,您可以在用户和事件之间进行关系收集.它类似于表格数据存储中的代理表.索引事件和用户字段,它应该非常快,可以帮助您更好地规范化数据.

我喜欢绘制平面结构的效率与保持标准化的效率,当我需要更新记录数据与读出查询中需要的内容时.你可以用大O表示法来做,但你不必那么花哨.只需根据一些具有不同数据模型的用例将一些数字放在纸上,并获得有关需要多少工作的良好直觉.

基本上我所做的是首先尝试预测记录将有多少次更新的概率与它读取的频率.然后我尝试预测更新的成本与读取的比例,当它被标准化或扁平化时(或者可能是两部分的组合,我可以设想...许多优化选项).然后,我可以判断保持平稳的成本与从标准化来源建立数据的成本.一旦我绘制了所有变量,如果保持平衡的节省使我节省了一大堆,那么我将保持平坦.

一些提示:

如果你需要快速和原子的快速查找(完全是最新的),你可能需要一个有利于解决方案,你喜欢扁平化而不是规范化并对更新进行点击.

如果您需要快速更新,并立即访问,则支持规范化.

如果您需要快速查找但不需要完美的最新数据,请考虑在批处理作业中构建规范化数据(可能使用map/reduce).

如果您的查询需要快速,并且更新很少,并且不一定要求您的更新可以立即访问,或者需要事务级别锁定它已经100%的时间(为了保证您的更新写入磁盘),可以考虑将更新写入队列,在后台处理它们.(在此模型中,您可能必须稍后处理冲突解决和协调).

配置不同型号.在代码中构建数据查询抽象层(如某种方式中的ORM),以便以后可以重构数据存储结构.

您可以使用许多其他想法.网上有很多很棒的博客,比如highscalabilty.org,并确保你理解CAP定理.

还要考虑一个缓存层,如Redis或memcache.我将其中一个产品放在我的数据层前面.当我查询mongo(存储所有规范化的内容)时,我使用数据构造一个展平的表示并将其存储在缓存中.当我更新数据时,我将使缓存中引用我正在更新的内容的任何数据无效.(尽管您必须花费时间使数据无效并跟踪缓存中的数据,并将其更新为考虑您的缩放因子).曾经有人曾说过"计算机科学中最难的两件事就是命名和缓存失效."

希望有所帮助!

推荐阅读

程序员
两个ImageView出现在Navigation标题中,而我只在xml中设置了一个

如何解决《两个ImageView出现在Navigation标题中,而我只在xml中设置了一个》经验，为你挑选了1个好方法。 ... [详细]
程序员
在ios的背景中连续显示"打开蓝牙以允许应用程序连接到附件"警报消息

如何解决《在ios的背景中连续显示"打开蓝牙以允许应用程序连接到附件"警报消息》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何检查javascript数组中是否存在密钥？

如何解决《如何检查javascript数组中是否存在密钥？》经验，为你挑选了2个好方法。 ... [详细]
程序员
按位AND和OR运算的说明

如何解决《按位AND和OR运算的说明》经验，为你挑选了1个好方法。 ... [详细]
程序员
max在一组列表上做了什么？

如何解决《max在一组列表上做了什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在R中的函数中保存单个对象：RData文件的大小非常大

如何解决《在R中的函数中保存单个对象：RData文件的大小非常大》经验，为你挑选了1个好方法。 ... [详细]
程序员
以4k(3840*2160)分辨率缩放Tkinter GUI？

如何解决《以4k(3840*2160)分辨率缩放TkinterGUI？》经验，为你挑选了1个好方法。 ... [详细]
程序员
基于已安装的引擎,使用url_for获取基于约束的url

如何解决《基于已安装的引擎,使用url_for获取基于约束的url》经验，为你挑选了1个好方法。 ... [详细]
程序员
当app强制退出时如何恢复下载？

如何解决《当app强制退出时如何恢复下载？》经验，为你挑选了0个好方法。 ... [详细]
程序员
改变Tx蓝牙Linux无效

如何解决《改变Tx蓝牙Linux无效》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Aurelia repeat.for中有条件地添加或删除CSS类？

如何解决《如何在Aureliarepeat.for中有条件地添加或删除CSS类？》经验，为你挑选了1个好方法。 ... [详细]
程序员
ForkJoinPool.invoke()和ForkJoinTask.invoke()或compute()

如何解决《ForkJoinPool.invoke()和ForkJoinTask.invoke()或compute()》经验，为你挑选了1个好方法。 ... [详细]
程序员
多个广告尺寸的Google广告会导致失败

如何解决《多个广告尺寸的Google广告会导致失败》经验，为你挑选了0个好方法。 ... [详细]
程序员
正则表达式(C#)对于RFC 4180的CSV

如何解决《正则表达式(C#)对于RFC4180的CSV》经验，为你挑选了0个好方法。 ... [详细]
程序员
IntelliJ - 查找未记录的公共方法

如何解决《IntelliJ-查找未记录的公共方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
与'wss:// ...'的WebSocket连接失败:连接建立错误:net :: ERR_CONNECTION_CLOSED

如何解决《与'wss://'的WebSocket连接失败:连接建立错误:net::ERR_CONNECTION_CLOSED》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么要将String转换为String？

如何解决《为什么要将String转换为String？》经验，为你挑选了1个好方法。 ... [详细]
程序员
c中的typedef枚举说明

如何解决《c中的typedef枚举说明》经验，为你挑选了2个好方法。 ... [详细]
程序员
用于组件的Typescript Angular 1.5 defintion文件

如何解决《用于组件的TypescriptAngular1.5defintion文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
由于"signed char"和"char",系统头文件中的重定义错误

如何解决《由于"signedchar"和"char",系统头文件中的重定义错误》经验，为你挑选了0个好方法。 ... [详细]

wurtjq

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章