我有一个数据库,表中有一个表中有数十亿行的表一个月,而且我有过去5年的数据.我试图以所有可能的方式优化数据,但延迟并没有减少.我知道有一些解决方案,比如使用水平扯皮和垂直褶皱.但我不确定任何开源实现和进行切换所需的开发时间.有没有人有使用这种系统的经验?
谢谢.
没有用例,没有人可以提出任何建议.如果您的数据大小为" Sagan-esque ",则用例非常重要,因为您可能已经发现,根本没有任何"通用"技术可行.数字太大了.
因此,您需要明确您要对此数据执行的操作.如果答案是"一切",那么你的表现就会变慢,因为你无法优化"一切".
编辑:
嗯,这是什么?2或3?结果有多大?你需要访问所有5年或仅仅是上个月?你真的需要所有细节,还是可以总结一下?你需要对它进行排序吗?钥匙够用吗?数据多久更新一次?更新数据后,数据需要多快才能上线?数据需要什么样的服务级别?24x7x7?9-5x5?天老数据还行吗?谁在使用这些数据?互动用户?批量报告?出口到外部实体?