稀疏数据:在RDBMS中高效存储和检索

作者：小白也坚强_177 | 2023-09-01 13:10

如何解决《稀疏数据:在RDBMS中高效存储和检索》经验，为你挑选了1个好方法。

我有一个表格,表示项目修订版中源文件指标的值,如下所示:

Revision FileA FileB FileC FileD FileE ...
1           45     3    12   123   124
2           45     3    12   123   124
3           45     3    12   123   124
4           48     3    12   123   124
5           48     3    12   123   124
6           48     3    12   123   124
7           48    15    12   123   124

(上述数据的关系视图不同.每行包含以下列:Revision,FileId,Value.从中计算数据的文件及其修订版存储在Subversion存储库中,因此我们试图表示存储库的关系模式中的结构.)

10000次修订中最多可以有23750个文件(ImageMagick绘图程序就是这种情况).如您所见,连续修订之间的大多数值都是相同的,因此表的有用数据非常稀疏.我正在寻找一种存储数据的方法

避免复制并有效利用空间(目前非稀疏表示需要260 GB(数据+索引),少于我想要存储的数据的10%)

允许我使用SQL查询有效地检索特定修订的值(无需显式循环修订或文件)

允许我有效地检索特定度量值的修订版.

理想情况下,解决方案不应依赖于特定的RDBMS,而应与Hibernate兼容.如果这是不可能的,我可以使用Hibernate,MySQL或PostgreSQL特有的功能.

1> Tom H..：

这就是我对它进行建模的方式.我遗漏了Revisions表和Files表,因为它们应该是不言自明的.

CREATE TABLE Revision_Files
(
    start_revision_number   INT NOT NULL,
    end_revision_number     INT NOT NULL,
    file_number             INT NOT NULL,
    value                   INT NOT NULL,
    CONSTRAINT PK_Revision_Files PRIMARY KEY CLUSTERED (start_revision_number, file_number),
    CONSTRAINT CHK_Revision_Files_start_before_end CHECK (start_revision_number <= end_revision_number)
)
GO

要获取特定修订版文件的所有值,可以使用以下查询.使用外部联接加入文件表可以让您获得那些没有为该修订定义的值.

SELECT
    REV.revision_number,
    RF.file_number,
    RF.value
FROM
    Revisions REV
INNER JOIN Revision_Files RF ON
    RF.start_revision_number <= REV.revision_number AND
    RF.end_revision_number >= REV.revision_number
GO

假设我在第三点中正确理解了您想要的内容,这将使您获得特定文件具有特定值的所有修订:

SELECT
    REV.revision_number
FROM
    Revision_Files RF
INNER JOIN Revisions REV ON
    REV.revision_number BETWEEN RF.start_revision_number AND RF.end_revision_number
WHERE
    RF.file_number = @file_number AND
    RF.value = @value
GO

推荐阅读

程序员
groovy if语句与变量中的正则表达式

如何解决《groovyif语句与变量中的正则表达式》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用fetch时拒绝承诺

如何解决《使用fetch时拒绝承诺》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Sails.js中使用客户端模板

如何解决《在Sails.js中使用客户端模板》经验，为你挑选了1个好方法。 ... [详细]
程序员
warpPerspective和perspectiveTransform之间有所不同

如何解决《warpPerspective和perspectiveTransform之间有所不同》经验，为你挑选了1个好方法。 ... [详细]
程序员
Unity WebGL的EditorUtility.OpenFilePanel(运行时)

如何解决《UnityWebGL的EditorUtility.OpenFilePanel(运行时)》经验，为你挑选了1个好方法。 ... [详细]
程序员
Webpack extract-text-webpack-plugin和css-loader缩小

如何解决《Webpackextract-text-webpack-plugin和css-loader缩小》经验，为你挑选了1个好方法。 ... [详细]
程序员
Tensorflow卷积神经网络 - 使用小数据集进行训练,对图像应用随机变化

如何解决《Tensorflow卷积神经网络-使用小数据集进行训练,对图像应用随机变化》经验，为你挑选了0个好方法。 ... [详细]
程序员
C#聚合在一个更好的时间复杂性

如何解决《C#聚合在一个更好的时间复杂性》经验，为你挑选了1个好方法。 ... [详细]
程序员
React,用它来区分对象

如何解决《React,用它来区分对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
从ionic生成非调试apk

如何解决《从ionic生成非调试apk》经验，为你挑选了2个好方法。 ... [详细]
程序员
app.get在Node/Express中返回undefined

如何解决《app.get在Node/Express中返回undefined》经验，为你挑选了1个好方法。 ... [详细]
程序员
c#list.OrderBy根本不工作？

如何解决《c#list.OrderBy根本不工作？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Laravel中处理url的字符大小写？

如何解决《在Laravel中处理url的字符大小写？》经验，为你挑选了1个好方法。 ... [详细]
程序员
std :: list按索引删除元素

如何解决《std::list按索引删除元素》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在字体真棒图标中创建过渡效果

如何解决《如何在字体真棒图标中创建过渡效果》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从bitbake构建的最终rootfs映像中删除特定的包

如何解决《如何从bitbake构建的最终rootfs映像中删除特定的包》经验，为你挑选了1个好方法。 ... [详细]
程序员
从一组数组中返回最大的数组

如何解决《从一组数组中返回最大的数组》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法在Windows 10中以管理员身份更改系统变量路径

如何解决《无法在Windows10中以管理员身份更改系统变量路径》经验，为你挑选了1个好方法。 ... [详细]
程序员
AVAudioEngine可录制麦克风和声音文件,避免反馈循环

如何解决《AVAudioEngine可录制麦克风和声音文件,避免反馈循环》经验，为你挑选了0个好方法。 ... [详细]
程序员
Javascript单击iframe内的坐标

如何解决《Javascript单击iframe内的坐标》经验，为你挑选了0个好方法。 ... [详细]

小白也坚强_177

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章