在Amazon Redshift中,使用Diststyle ALL的桌子应该有多小?
它在这里说:http
://dwbitechguru.blogspot.com/2014/11/performance-tuning-in-amazon-redshift.html对于vey小表,redshift应该使用diststyle ALL而不是EVEN或KEY.小有多小?如果我要在查询的where子句中指定行号:select relname, reldiststyle from pg_class
我应该指定多少行?
这实际上取决于您使用的群集大小.DISTSTYLE ALL会将表的数据复制到所有节点 - 以减少跨节点的数据传输要求.您可以找到表的大小和Redshift节点的可用大小,如果您能够为每个节点多次复制表,那就去做吧!
此外,如果您需要非常频繁地使用此表加入其他表,例如70%的查询,我相信如果您想要更好的查询性能,这是值得的.
如果跨表的连接键在基数方面相同,那么您还可以在该键上分配所有表,以便类似的键位于同一节点中,这将避免数据复制.
我建议尝试上面的两个选项,并比较大约10个查询的平均查询运行时间,然后做出决定.