如何在分布式数据上实现排序和分页？

作者：手机用户2402851335 | 2023-06-27 15:08

如何解决《如何在分布式数据上实现排序和分页？》经验，为你挑选了1个好方法。

这是我试图解决的问题:

我需要能够显示存储在多个数据库分片中的分页,排序数据表.

分页和排序是众所周知的问题,当数据来自单一来源时,我们大多数人都可以通过多种方式解决这些问题.但是,如果您要跨分片或使用DHT或分布式文档数据库或您喜欢的任何NoSQL风格分割数据,事情会变得更加复杂.

这是一个非常小的数据集的简单图片:

碎片| 数据
1 | A
1 | D
1 | G
2 | B
2 | E
2 | H
3 | C
3 | F
3 | 一世

分页到页面(页面大小= 3):

页面| 数据
1 | A
1 | B
1 | C
2 | D
2 | E
2 | F
3 | G
3 | H
3 | 一世

如果我们想要显示用户页面2,我们将返回:

D
E
F.

如果所讨论的表的大小类似于1000万行或1亿行,则不能仅将所有数据下载到Web /应用程序服务器上以对其进行排序并返回正确的页面.而且你显然不能让每个单独的分片排序并分页自己的数据片段,因为分片彼此不了解.

更复杂的是,我需要呈现的数据不能太过时,因此提前预先计算一组有用的排序并存储结果以供以后检索是不切实际的.

1> Gintautas Mi..：

有几个解决方案,其中一些可能对您不可行,但可能其中一个会坚持:

按此值的输入范围进行分片(例如,分片1包含AC,分片2 DF等).或者,使用另一个具有此表的外键的表作为索引,并使用此系统对索引表进行分片.这样您就可以轻松找到并获取指定的范围.如果你能做到这一点,这个解决方案在性能方面可能是最好的(它假设分片的数量是静态的,而且碎片是可靠的).

通过二进制搜索识别页面项.例如,假设您需要项目100到110.对于每个分片,按字典顺序计算"M"以下的值的数量.如果数字的总和大于100,则减小轴心点,否则增加它(使用二进制搜索).确定第100个项目(页面上的第一个项目)后,从每个分片中取出大于该项目的前9(10 - 1)个项目,获取它们,对整个列表进行排序,从列表中取出前9项,前置第一项,那是你的页面!这种方法更难以实现,并且需要O(log(n))查询,因此它比(1)慢,但如果负载不是很重,仍然可能相当快.

存储每个值的页码.这会给你极快的读取速度,但写入速度非常慢,所以它只适用于写入次数非常少的情况(或者只根据有序变量附加).

推荐阅读

程序员
最终参数在哪里存储在匿名类实例中？

如何解决《最终参数在哪里存储在匿名类实例中？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用java中的REGEX从字符串解析浮点值

如何解决《如何使用java中的REGEX从字符串解析浮点值》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在PHP中以DD-MMM-YY格式获取实际日期？

如何解决《如何在PHP中以DD-MMM-YY格式获取实际日期？》经验，为你挑选了2个好方法。 ... [详细]
程序员
在jquery中更改多个div位置

如何解决《在jquery中更改多个div位置》经验，为你挑选了1个好方法。 ... [详细]
程序员
iOS应用更新大小远大于应用大小

如何解决《iOS应用更新大小远大于应用大小》经验，为你挑选了1个好方法。 ... [详细]
程序员
指定使用jar文件的通用文件路径

如何解决《指定使用jar文件的通用文件路径》经验，为你挑选了1个好方法。 ... [详细]
程序员
Windows批处理字符串替换在变量给出搜索字符串时不起作用

如何解决《Windows批处理字符串替换在变量给出搜索字符串时不起作用》经验，为你挑选了0个好方法。 ... [详细]
程序员
有没有办法在Elixir中检查函数的arity？

如何解决《有没有办法在Elixir中检查函数的arity？》经验，为你挑选了1个好方法。 ... [详细]
程序员
暂停ansible playbook以进行用户确认,是否运行休息任务

如何解决《暂停ansibleplaybook以进行用户确认,是否运行休息任务》经验，为你挑选了1个好方法。 ... [详细]
程序员
ggplot2垂直线未插入所需位置

如何解决《ggplot2垂直线未插入所需位置》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Docker Hub和私有映像的Kubernetes PullImageError

如何解决《使用DockerHub和私有映像的KubernetesPullImageError》经验，为你挑选了2个好方法。 ... [详细]
程序员
Rest API的swagger和loopback之间的区别

如何解决《RestAPI的swagger和loopback之间的区别》经验，为你挑选了2个好方法。 ... [详细]
程序员
scanf和格式有关吗？

如何解决《scanf和格式有关吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
整数除法SQL查询产生意外的小数位数

如何解决《整数除法SQL查询产生意外的小数位数》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以从.NET中的REST API获取复杂的Entity Framework对象而无需创建ViewModel对象？

如何解决《是否可以从.NET中的RESTAPI获取复杂的EntityFramework对象而无需创建ViewModel对象？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用Symfony从安全位置提供文件

如何解决《使用Symfony从安全位置提供文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用正则表达式从Google BigQuery中的字符串中提取数字

如何解决《使用正则表达式从GoogleBigQuery中的字符串中提取数字》经验，为你挑选了1个好方法。 ... [详细]
程序员
功能或阶级之外的"超级"

如何解决《功能或阶级之外的"超级"》经验，为你挑选了1个好方法。 ... [详细]
程序员
从Python 2移植到Python 3:'utf-8编解码器无法解码字节'

如何解决《从Python2移植到Python3:'utf-8编解码器无法解码字节'》经验，为你挑选了1个好方法。 ... [详细]
程序员
将非单调转换为R中的单调数据

如何解决《将非单调转换为R中的单调数据》经验，为你挑选了1个好方法。 ... [详细]

手机用户2402851335

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章