我正在为每台机器使用带有1G缓存的ElasticSearch集群.我将搜索者配置为5000/perpage.
当我搜索第3页时,它花费大约400毫秒.但是当我搜索第300页时,成本增加到超过5000毫秒!在这种情况下,大约60%的缓存是免费的.
为什么成本增加了10倍以上?
为了寻找那么远,Elasticsearch必须检索所有以前的页面,只是为了在最后丢弃它们.搜索from: 1000, size: 100
相当于搜索from: 0, size: 100100
,只是您获得最后100个结果.这也意味着,必须对每个文档进行评分,这是一项潜在的昂贵操作.
有一个最近的优化,在这种情况下应该提高性能,当你使用滚动搜索时,请参阅此github问题.