我们应该对数据库进行非规范化以提高性能吗

作者：wurtjq | 2023-07-11 10:27

如何解决《我们应该对数据库进行非规范化以提高性能吗》经验，为你挑选了1个好方法。

我们要求每秒存储500次测量,来自多个设备.每个度量由时间戳,数量类型和几个向量值组成.现在每次测量有8个矢量值,我们可能会认为这个数字对于原型项目的需求是恒定的.我们正在使用HNibernate.测试是在SQLite(磁盘文件db,而不是内存)中完成的,但生产可能是MsSQL.

我们的Measurement实体类是包含单个度量的类,如下所示:

public class Measurement
{
    public virtual Guid Id { get; private set; }
    public virtual Device Device { get; private set; }
    public virtual Timestamp Timestamp { get; private set; }
    public virtual IList Vectors { get; private set; }
}

矢量值存储在单独的表中,以便它们中的每一个通过外键引用其父测量值.

我们已经做了几件事情,以确保生成的SQL(合理)高效:我们正在使用Guid.Comb生成的ID,我们正在冲洗在一个事务中约500项,ADO.Net批量大小设置为100(我认为SQLIte不支持批量更新？但以后可能会有用).

问题

现在我们可以每秒插入150-200个测量值(这还不够快,尽管这是我们正在讨论的SQLite).查看生成的SQL,我们可以看到在单个事务中插入(按预期):

1个时间戳

1测量

8个矢量值

这意味着我们实际上要多做10倍的单表插入:每秒1500-2000.

如果我们将所有内容(所有8个向量值和时间戳)放入测量表(添加9个专用列),似乎我们可以将插入速度提高10倍.

切换到SQL服务器将提高性能,但我们想知道是否有办法避免与数据库组织方式相关的不必要的性能成本.

[编辑]

对于内存中的SQLite,我得到大约350项/秒(3500个单表插入),我相信它与NHibernate一样好(以此帖子作为参考:http://ayende.com/Blog/archive/ 2009/08/22/nhibernate-perf-tricks.aspx).

但我不妨切换到SQL服务器并停止假设,对吧？我会在测试后立即更新我的帖子.

[更新]

我已经转移到SQL服务器并使我的层次结构扁平化,我通过存储3000次测量/秒几个小时来测试它,它似乎工作正常.

1> EdgarVerona..：

就个人而言,我会说它:denormalize,然后创建一个ETL过程,将这些数据转换为更加规范化的格式,以便进行分析/定期使用.

基本上,理想的情况可能是拥有一个单独的数据库(或者甚至只需要在同一个数据库中使用单独的表),这些数据库将数据采集视为完全独立的事情,而不是以您需要处理的格式它.

这并不意味着你需要丢弃你在当前数据库结构周围创建的实体:只是你还应该创建那些非规范化表并创建一个ETL来引入它们.你可以使用SSIS(虽然它仍然是非常麻烦和烦躁)定期将数据带入规范化的表格集,甚至是C#app或其他批量加载过程.

编辑:当然,这是假设你的分析不需要实时完成:只是数据的集合.通常,人们不需要(有时甚至实际上不希望)实时更新分析数据.这是纸上听起来不错的事情之一,但在实践中它是不必要的.

如果分析这些数据的某些人需要实时访问,您可以根据需要构建一个针对"裸机"非规范化事务数据的工具集:但是当您真正深入了解需求时,执行分析的人员不需要真正实时(在某些情况下,他们更愿意使用更静态的数据集来处理!):在这种情况下,定期ETL可以很好地工作.您只需与目标用户聚在一起,找出他们真正需要的东西.

推荐阅读

程序员
CloudFront + S3网站:应显示隐式索引文档时"指定的密钥不存在"

如何解决《CloudFront+S3网站:应显示隐式索引文档时"指定的密钥不存在"》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用网络摄像头拍照是黑色输出[Unity3D]

如何解决《使用网络摄像头拍照是黑色输出[Unity3D]》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何实现S3类的名称？

如何解决《如何实现S3类的名称？》经验，为你挑选了1个好方法。 ... [详细]
程序员
react-native将子视图置于最前面

如何解决《react-native将子视图置于最前面》经验，为你挑选了0个好方法。 ... [详细]
程序员
查看mysql查询缓存内容

如何解决《查看mysql查询缓存内容》经验，为你挑选了2个好方法。 ... [详细]
程序员
Chrome扩展程序存储了大量数据

如何解决《Chrome扩展程序存储了大量数据》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法运行总计工作

如何解决《无法运行总计工作》经验，为你挑选了1个好方法。 ... [详细]
程序员
Nette PHP框架和带有令牌认证的RESTful API

如何解决《NettePHP框架和带有令牌认证的RESTfulAPI》经验，为你挑选了1个好方法。 ... [详细]
程序员
git和vimdiff - 一次关闭所有文件

如何解决《git和vimdiff-一次关闭所有文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
逻辑运算符和分支预测失败

如何解决《逻辑运算符和分支预测失败》经验，为你挑选了0个好方法。 ... [详细]
程序员
在perl脚本中使用$ self创建实例时出错

如何解决《在perl脚本中使用$self创建实例时出错》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在xamarin.forms pcl项目中配置地图？

如何解决《如何在xamarin.formspcl项目中配置地图？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Java中创建太多线程

如何解决《在Java中创建太多线程》经验，为你挑选了1个好方法。 ... [详细]
程序员
复选框未在javascript中检查？

如何解决《复选框未在javascript中检查？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用包含swift中相同键的多个值的查询参数构建URL？

如何解决《如何使用包含swift中相同键的多个值的查询参数构建URL？》经验，为你挑选了3个好方法。 ... [详细]
程序员
将指针传递给const ref函数

如何解决《将指针传递给constref函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否有可用的应用内聊天SDK？

如何解决《是否有可用的应用内聊天SDK？》经验，为你挑选了1个好方法。 ... [详细]
程序员
禁止不断访问我的C#/ Azure网站的IP地址？

如何解决《禁止不断访问我的C#/Azure网站的IP地址？》经验，为你挑选了1个好方法。 ... [详细]
程序员
反应警告渲染()

如何解决《反应警告渲染()》经验，为你挑选了1个好方法。 ... [详细]
程序员
RxSwift:基于文本字段的启用/禁用按钮不为空

如何解决《RxSwift:基于文本字段的启用/禁用按钮不为空》经验，为你挑选了1个好方法。 ... [详细]

wurtjq

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章