BulkRequestBuilder的Elasticsearch索引速度变慢

作者：跟我搞对象吧 | 2023-07-11 17:48

如何解决《BulkRequestBuilder的Elasticsearch索引速度变慢》经验，为你挑选了1个好方法。

大家好,所有的弹性研究大师.

我有数百万个数据要由elasticsearch Java API索引.elasticsearch的集群节点数为3(1作为主节点+ 2节点).

我的代码片段如下.

Settings settings = ImmutableSettings.settingsBuilder()
     .put("cluster.name", "MyClusterName").build();

TransportClient client = new TransportClient(settings);
String hostname = "myhost ip";
int port = 9300; 
client.addTransportAddress(new InetSocketTransportAddress(hostname, port));

BulkRequestBuilder bulkBuilder = client.prepareBulk();
BufferedReader br = new BufferedReader(new InputStreamReader(new DataInputStream(new FileInputStream("my_file_path"))));
long bulkBuilderLength = 0;
String readLine = "";
String index = "my_index_name";
String type = "my_type_name";
String id = "";

while((readLine = br.readLine()) != null){

    id = somefunction(readLine);
    String json = new ObjectMapper().writeValueAsString(readLine);
    bulkBuilder.add(client.prepareIndex(index, type, id)
        .setSource(json));
    bulkBuilderLength++;
    if(bulkBuilderLength % 1000== 0){
        logger.info("##### " + bulkBuilderLength + " data indexed.");
        BulkResponse bulkRes = bulkBuilder.execute().actionGet();
        if(bulkRes.hasFailures()){
            logger.error("##### Bulk Request failure with error: " + bulkRes.buildFailureMessage());
        }
    }
}

br.close();

if(bulkBuilder.numberOfActions() > 0){
    logger.info("##### " + bulkBuilderLength + " data indexed.");
    BulkResponse bulkRes = bulkBuilder.execute().actionGet();
    if(bulkRes.hasFailures()){
        logger.error("##### Bulk Request failure with error: " + bulkRes.buildFailureMessage());
    }
    bulkBuilder = client.prepareBulk();
}

它工作正常,但在成千上万的文档之后,性能迅速下降.

我已经尝试将" refresh_interval "的设置值更改为-1,将" number_of_replicas " 更改为0. 但是,性能下降的情况是一样的.

如果我使用bigdesk监控集群的状态,则GC值每秒都会达到1,如下面的屏幕截图所示.

有人可以帮帮我吗？

提前致谢.

在此输入图像描述

===================更新===========================

最后,我已经解决了这个问题.(见答案).

问题的原因是我错过了重新创建一个新的BulkRequestBuilder.在我更改了下面的代码片段后,性能降低从未发生过.

非常感谢你.

Settings settings = ImmutableSettings.settingsBuilder()
     .put("cluster.name", "MyClusterName").build();

TransportClient client = new TransportClient(settings);
String hostname = "myhost ip";
int port = 9300; 
client.addTransportAddress(new InetSocketTransportAddress(hostname, port));

BulkRequestBuilder bulkBuilder = client.prepareBulk();
BufferedReader br = new BufferedReader(new InputStreamReader(new DataInputStream(new FileInputStream("my_file_path"))));
long bulkBuilderLength = 0;
String readLine = "";
String index = "my_index_name";
String type = "my_type_name";
String id = "";

while((readLine = br.readLine()) != null){

    id = somefunction(readLine);
    String json = new ObjectMapper().writeValueAsString(readLine);
    bulkBuilder.add(client.prepareIndex(index, type, id)
        .setSource(json));
    bulkBuilderLength++;
    if(bulkBuilderLength % 1000== 0){
        logger.info("##### " + bulkBuilderLength + " data indexed.");
        BulkResponse bulkRes = bulkBuilder.execute().actionGet();
        if(bulkRes.hasFailures()){
            logger.error("##### Bulk Request failure with error: " + bulkRes.buildFailureMessage());
        }
        bulkBuilder = client.prepareBulk();  // This line is my mistake and the solution !!!
    }
}

br.close();

if(bulkBuilder.numberOfActions() > 0){
    logger.info("##### " + bulkBuilderLength + " data indexed.");
    BulkResponse bulkRes = bulkBuilder.execute().actionGet();
    if(bulkRes.hasFailures()){
        logger.error("##### Bulk Request failure with error: " + bulkRes.buildFailureMessage());
    }
    bulkBuilder = client.prepareBulk();
}

dadoonet.. 8

这里的问题是您在批量执行后不再重新创建一个新的Bulk.

这意味着您要一次又一次地重新索引相同的第一个数据.

顺便说一句,看看BulkProcessor类.绝对更好用.

1> dadoonet..：

这里的问题是您在批量执行后不再重新创建一个新的Bulk.

这意味着您要一次又一次地重新索引相同的第一个数据.

顺便说一句,看看BulkProcessor类.绝对更好用.

BulkProcessor是Bulk API之上的一个层.所以吞吐量相同.

推荐阅读

程序员
秒表应用程序计数器走得太快

如何解决《秒表应用程序计数器走得太快》经验，为你挑选了1个好方法。 ... [详细]
程序员
在MSTest中如何在TestCleanup中访问TestMethod异常而不在测试方法中使用try/catch块

如何解决《在MSTest中如何在TestCleanup中访问TestMethod异常而不在测试方法中使用try/catch块》经验，为你挑选了0个好方法。 ... [详细]
程序员
Angular 2引导函数给出错误"参数类型AppComponent不可分配给参数类型类型"

如何解决《Angular2引导函数给出错误"参数类型AppComponent不可分配给参数类型类型"》经验，为你挑选了4个好方法。 ... [详细]
程序员
使用python输入重定向

如何解决《使用python输入重定向》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么"transform-es2015-modules-commonjs"在Babel 6中添加"use strict"？

如何解决《为什么"transform-es2015-modules-commonjs"在Babel6中添加"usestrict"？》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法使用键盘在Chrome中选择满意的文字

如何解决《无法使用键盘在Chrome中选择满意的文字》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何设置我的VS 2013 TypeScript项目来编译我的打字稿文件但排除我的node_modules？

如何解决《如何设置我的VS2013TypeScript项目来编译我的打字稿文件但排除我的node_modules？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Spring Boot @ControllerAdvice异常处理程序没有触发

如何解决《SpringBoot@ControllerAdvice异常处理程序没有触发》经验，为你挑选了0个好方法。 ... [详细]
程序员
Python PIL - 寻找最近的颜色(圆角颜色)

如何解决《PythonPIL-寻找最近的颜色(圆角颜色)》经验，为你挑选了1个好方法。 ... [详细]
程序员
与visual studio一起使用angular2

如何解决《与visualstudio一起使用angular2》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否必须在多线程环境中为long类型实例常量声明volatile？

如何解决《是否必须在多线程环境中为long类型实例常量声明volatile？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用rxandroid来监听gps位置更新

如何解决《如何使用rxandroid来监听gps位置更新》经验，为你挑选了1个好方法。 ... [详细]
程序员
逻辑错误,在Tic Tac Toe中检查获胜者

如何解决《逻辑错误,在TicTacToe中检查获胜者》经验，为你挑选了0个好方法。 ... [详细]
程序员
逐行打印python列表中的列表

如何解决《逐行打印python列表中的列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
在GameScene中显示UIAlertController(SpriteKit/Swift)

如何解决《在GameScene中显示UIAlertController(SpriteKit/Swift)》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Aurelia中将自定义元素替换为模板本身(而不是将其包含在自定义元素中)？

如何解决《在Aurelia中将自定义元素替换为模板本身(而不是将其包含在自定义元素中)？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Spring Boot @autowired不起作用,类在不同的包中

如何解决《SpringBoot@autowired不起作用,类在不同的包中》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在C++中实现指向成员函数的指针？

如何解决《如何在C++中实现指向成员函数的指针？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java得到一个double的前2个十进制数字

如何解决《Java得到一个double的前2个十进制数字》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么jquery-ajax多次提交表单？

如何解决《为什么jquery-ajax多次提交表单？》经验，为你挑选了2个好方法。 ... [详细]

跟我搞对象吧

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章