当前位置:  开发笔记 > 编程语言 > 正文

java中性能密集的字符串拆分和操作

如何解决《java中性能密集的字符串拆分和操作》经验,为你挑选了1个好方法。

通过非常简单的分隔符分割字符串的最有效方法是什么?

一些背景:

我正在移植一个我在C中用一堆指针算法编写的函数到java并且它非常慢(经过一些优化仍然慢了5*).对它进行了分析后,发现很多开销都在String.split中

有问题的函数采用主机名或IP地址并使其成为通用的:

123.123.123.123 - >*123.123.123

abcexample.com - >*example.com.

这可以定期运行数百万个项目,因此性能是一个问题.

编辑:转换的规则是:

如果是IP地址,请替换第一部分

否则,找到主域名,并使前面的部分通用.

foo.bar.com->*.bar.com foo.bar.co.uk->*.bar.co.uk

我现在已经使用lastIndexOf和substring重写了自己从后面工作,性能得到了突飞猛进的提升.

我会在24小时之前将问题保持开放,然后再确定最佳答案以供将来参考

这就是我现在提出的(在调用此函数之前,ip部分是一个无关紧要的检查)

private static String hostConvert(String in) {
    final String [] subs = { "ac", "co", "com", "or", "org", "ne", "net", "ad", "gov", "ed" };

    int dotPos = in.lastIndexOf('.');
    if(dotPos == -1)
        return in;
    int prevDotPos = in.lastIndexOf('.', dotPos-1);
    if(prevDotPos == -1)
        return in;
    CharSequence cs = in.subSequence(prevDotPos+1, dotPos);
    for(String cur : subs) {
        if(cur.contentEquals(cs)) {
            int start = in.lastIndexOf('.', prevDotPos-1);
            if(start == -1 || start == 0)
                return in;
            return "*" + in.substring(start);
        }
    }

    return "*" + in.substring(prevDotPos);
}

如果有进一步改进的空间,那么听听会很好.



1> polygenelubr..:

像这样的事情就像你能做到的一样快:

static String starOutFirst(String s) {
    final int K = s.indexOf('.');
    return "*" + s.substring(K);
}
static String starOutButLastTwo(String s) {
    final int K = s.lastIndexOf('.', s.lastIndexOf('.') - 1);
    return "*" + s.substring(K);
}

然后你可以这样做:

    System.out.println(starOutFirst("123.123.123.123"));
    // prints "*.123.123.123"

    System.out.println(starOutButLastTwo("a.b.c.example.com"));
    // prints "*.example.com"

您可能需要使用正则表达式来查看两种方法中哪一种适用于任何给定的字符串.

推荐阅读
手机用户2402851155
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有