弹性搜索的索引速度为1000万个事件

作者：低调pasta_730 | 2023-06-14 16:41

如何解决《弹性搜索的索引速度为1000万个事件》经验，为你挑选了1个好方法。

我试图找出为什么elasticsearch在索引方面如此缓慢.我不确定它是否是对弹性搜索本身的限制,但我会分享到目前为止我所拥有的.

我有一个弹性搜索节点和一个框上运行的logstash实例.我的文档有大约15个字段,我有一个弹性搜索映射设置与正确的类型(虽然我尝试没有映射,得到几乎相同的结果).

我一次索引大约800万到1000万个事件,并采取了以下方法.

使用以下格式的批量api(我将csv转换为JSON并将其放入我卷入的文件中

{"create" : {}}
{"field1" : "value1", "field2" : "value2 .... }
{"create" : {}}
{"field1" : "value1", "field2" : "value2 .... }
{"create" : {}}
{"field1" : "value1", "field2" : "value2 .... }

我也尝试使用tcp输入和原始csv或使用文件监听器的logstash,并将csv cat到文件logstash正在监听的末尾.

所有这三种方法似乎每秒摄取大约10,000个事件,这非常慢.

难道我做错了什么？我是否应该在批量摄取中明确指定ID而不是让它自动生成一个？

通过批量API摄取时,我将事件分成50,000和100,000个事件文件,并分别进行摄取.

1> kenzie..：

我推荐这个博客.在批量索引期间调整以下参数应该有所帮助,但是一旦完成,请减少refresh_interval.

 index.store.type: mmapfs
 indices.memory.index_buffer_size: 30%
 index.translog.flush_threshold_ops: 50000
 refresh_interval: 30s

推荐阅读

程序员
如何检查一对多映射表中是否存在特定映射

如何解决《如何检查一对多映射表中是否存在特定映射》经验，为你挑选了1个好方法。 ... [详细]
程序员
与R的音频比较

如何解决《与R的音频比较》经验，为你挑选了1个好方法。 ... [详细]
程序员
SSL认证适用于localhost,但不适用于计算机名称或IP

如何解决《SSL认证适用于localhost,但不适用于计算机名称或IP》经验，为你挑选了1个好方法。 ... [详细]
程序员
未知类型名称“ zend_string”

如何解决《未知类型名称“zend_string”》经验，为你挑选了1个好方法。 ... [详细]
程序员
R启动时如何覆盖2GB内存限制

如何解决《R启动时如何覆盖2GB内存限制》经验，为你挑选了0个好方法。 ... [详细]
程序员
Django编码为utf8无法正常工作

如何解决《Django编码为utf8无法正常工作》经验，为你挑选了0个好方法。 ... [详细]
程序员
Python中浮点数('Inf')有什么意义？

如何解决《Python中浮点数('Inf')有什么意义？》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用spring-hateoas反序列化JSON(链接+嵌入式容器)的便捷方法是什么？

如何解决《使用spring-hateoas反序列化JSON(链接+嵌入式容器)的便捷方法是什么？》经验，为你挑选了0个好方法。 ... [详细]
程序员
调试单元测试时,Visual Studio c#不应启动IIS网站

如何解决《调试单元测试时,VisualStudioc#不应启动IIS网站》经验，为你挑选了1个好方法。 ... [详细]
程序员
C#Task.WaitAll()如何将对象状态合并为一个？

如何解决《C#Task.WaitAll()如何将对象状态合并为一个？》经验，为你挑选了1个好方法。 ... [详细]
程序员
UIActivityViewController Gmail共享主题和正文相同

如何解决《UIActivityViewControllerGmail共享主题和正文相同》经验，为你挑选了0个好方法。 ... [详细]
程序员
在长模式下更改GDT并更新CS

如何解决《在长模式下更改GDT并更新CS》经验，为你挑选了1个好方法。 ... [详细]
程序员
[NSNull length]:无法识别的选择器在键盘按键上发送到实例？

如何解决《[NSNulllength]:无法识别的选择器在键盘按键上发送到实例？》经验，为你挑选了1个好方法。 ... [详细]
程序员
node js函数返回[object Object]而不是字符串值

如何解决《nodejs函数返回[objectObject]而不是字符串值》经验，为你挑选了1个好方法。 ... [详细]
程序员
从AWS SDK,如何获取当前登录的用户名(或IAM用户)？

如何解决《从AWSSDK,如何获取当前登录的用户名(或IAM用户)？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何创建动态子域rails

如何解决《如何创建动态子域rails》经验，为你挑选了0个好方法。 ... [详细]
程序员
Android编辑文本屏蔽

如何解决《Android编辑文本屏蔽》经验，为你挑选了0个好方法。 ... [详细]
程序员
在一段时间不活动后,在PHP CLI脚本中运行功能

如何解决《在一段时间不活动后,在PHPCLI脚本中运行功能》经验，为你挑选了0个好方法。 ... [详细]
程序员
Ruby哈希的map_values()？

如何解决《Ruby哈希的map_values()？》经验，为你挑选了2个好方法。 ... [详细]
程序员
在设计时未设置WPF转换器抛出对象引用

如何解决《在设计时未设置WPF转换器抛出对象引用》经验，为你挑选了0个好方法。 ... [详细]

低调pasta_730

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章