快速阅读文本文件的最后一行？

作者：李桂平2402851397 | 2023-08-28 19:11

如何解决《快速阅读文本文件的最后一行？》经验，为你挑选了3个好方法。

从Java中的[非常非常大的]文件中读取最后一行文本的最快捷,最有效的方法是什么？

1> Eric Leschin..：

下面是两个函数,一个返回文件的最后一个非空行而不加载或单步执行整个文件,另一个返回文件的最后N行而不单步执行整个文件:

尾巴的作用是直接缩放到文件的最后一个字符,然后逐个字符地逐个字符,记录它看到的内容,直到找到换行符.一旦找到换行符,它就会突破循环.反转记录的内容并将其抛入字符串并返回.0xA是新行,0xD是回车符.

如果您的行结尾是\r\n或者是crlf其他"双换行样式换行符",则必须指定n*2行才能获得最后n行,因为它为每行计算2行.

public String tail( File file ) {
    RandomAccessFile fileHandler = null;
    try {
        fileHandler = new RandomAccessFile( file, "r" );
        long fileLength = fileHandler.length() - 1;
        StringBuilder sb = new StringBuilder();

        for(long filePointer = fileLength; filePointer != -1; filePointer--){
            fileHandler.seek( filePointer );
            int readByte = fileHandler.readByte();

            if( readByte == 0xA ) {
                if( filePointer == fileLength ) {
                    continue;
                }
                break;

            } else if( readByte == 0xD ) {
                if( filePointer == fileLength - 1 ) {
                    continue;
                }
                break;
            }

            sb.append( ( char ) readByte );
        }

        String lastLine = sb.reverse().toString();
        return lastLine;
    } catch( java.io.FileNotFoundException e ) {
        e.printStackTrace();
        return null;
    } catch( java.io.IOException e ) {
        e.printStackTrace();
        return null;
    } finally {
        if (fileHandler != null )
            try {
                fileHandler.close();
            } catch (IOException e) {
                /* ignore */
            }
    }
}

但是你可能不想要最后一行,你想要最后N行,所以请改用它:

public String tail2( File file, int lines) {
    java.io.RandomAccessFile fileHandler = null;
    try {
        fileHandler = 
            new java.io.RandomAccessFile( file, "r" );
        long fileLength = fileHandler.length() - 1;
        StringBuilder sb = new StringBuilder();
        int line = 0;

        for(long filePointer = fileLength; filePointer != -1; filePointer--){
            fileHandler.seek( filePointer );
            int readByte = fileHandler.readByte();

             if( readByte == 0xA ) {
                if (filePointer < fileLength) {
                    line = line + 1;
                }
            } else if( readByte == 0xD ) {
                if (filePointer < fileLength-1) {
                    line = line + 1;
                }
            }
            if (line >= lines) {
                break;
            }
            sb.append( ( char ) readByte );
        }

        String lastLine = sb.reverse().toString();
        return lastLine;
    } catch( java.io.FileNotFoundException e ) {
        e.printStackTrace();
        return null;
    } catch( java.io.IOException e ) {
        e.printStackTrace();
        return null;
    }
    finally {
        if (fileHandler != null )
            try {
                fileHandler.close();
            } catch (IOException e) {
            }
    }
}

像这样调用上面的方法:

File file = new File("D:\\stuff\\huge.log");
System.out.println(tail(file));
System.out.println(tail2(file, 10));

警告在unicode的狂野西部,此代码可能导致此函数的输出错误.例如"Mary？s"而不是"Mary's".带有帽子,重音符号,汉字等的字符可能会导致输出错误,因为重音符号会在字符后添加为修饰符.反转复合字符会改变反转时字符身份的性质.您必须对计划使用此语言的所有语言进行全面的测试.

有关此unicode反转问题的更多信息,请阅读:http: //msmvps.com/blogs/jon_skeet/archive/2009/11/02/omg-ponies-aka-humanity-epic-fail.aspx

以上内容未考虑CR和LF终止的行.

2> jaco0646..：

Apache Commons有一个使用RandomAccessFile的实现.

它叫做ReversedLinesFileReader.

@JuanToroMarty可以遍历`readLine()`方法.

3> Jon Skeet..：

看看我对C#的类似问题的答案.虽然Java中的编码支持有些不同,但代码非常相似.

基本上,一般来说,这不是一件非常容易的事情.正如MSalter指出的那样,UTF-8确实很容易发现,\r或者\n因为这些字符的UTF-8表示与ASCII相同,并且这些字节不会以多字节字符出现.

所以基本上,取一个(比方说)2K的缓冲区,然后逐步向后读(在你之前跳到2K,读下一个2K)检查线路终止.然后跳到流中正确的位置,InputStreamReader在顶部创建一个,在顶部创建一个BufferedReader.然后打电话BufferedReader.readLine().

UTF-8并不重要 - 您需要最后一个CR或LF字符,它是ASCII和UTF-8中的单个字节.

推荐阅读

程序员
C++返回整个null分隔的字符串

如何解决《C++返回整个null分隔的字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
Laravel迁移禁用外键检查的好方法

如何解决《Laravel迁移禁用外键检查的好方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
Symfony2的.如何让表单忽略额外的字段？

如何解决《Symfony2的.如何让表单忽略额外的字段？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何构建vim插件,以便用户可以使用病原体安装它

如何解决《如何构建vim插件,以便用户可以使用病原体安装它》经验，为你挑选了1个好方法。 ... [详细]
程序员
你如何调用从另一个类继承的方法？

如何解决《你如何调用从另一个类继承的方法？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Backwards是否承认Monad实例？

如何解决《Backwards是否承认Monad实例？》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么在map周围包装list()导致函数运行？

如何解决《为什么在map周围包装list()导致函数运行？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Swift中使用Container View进行委派

如何解决《在Swift中使用ContainerView进行委派》经验，为你挑选了2个好方法。 ... [详细]
程序员
Hello-jni示例在Android Studio 2.0 Preview中不起作用

如何解决《Hello-jni示例在AndroidStudio2.0Preview中不起作用》经验，为你挑选了0个好方法。 ... [详细]
程序员
无法加载X11字体

如何解决《无法加载X11字体》经验，为你挑选了0个好方法。 ... [详细]
程序员
检查TextBox是否为空的最佳方法

如何解决《检查TextBox是否为空的最佳方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
三星6S上的C#.NET 4.5.1 MVC 5.2.2中的MP3流媒体

如何解决《三星6S上的C#.NET4.5.1MVC5.2.2中的MP3流媒体》经验，为你挑选了0个好方法。 ... [详细]
程序员
Django设置未知参数:TEMPLATE_DEBUG

如何解决《Django设置未知参数:TEMPLATE_DEBUG》经验，为你挑选了1个好方法。 ... [详细]
程序员
循环显示具有特定名称的工作表

如何解决《循环显示具有特定名称的工作表》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何更改对象的显示方式？

如何解决《如何更改对象的显示方式？》经验，为你挑选了1个好方法。 ... [详细]
程序员
控制器的ngdoc文档

如何解决《控制器的ngdoc文档》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何配置spring boot应用程序以使用aspectj事务？

如何解决《如何配置springboot应用程序以使用aspectj事务？》经验，为你挑选了0个好方法。 ... [详细]
程序员
在pycharm或eclipse + pydev中的C线程中不工作python断点

如何解决《在pycharm或eclipse+pydev中的C线程中不工作python断点》经验，为你挑选了1个好方法。 ... [详细]
程序员
可能的意外参考比较按预期工作

如何解决《可能的意外参考比较按预期工作》经验，为你挑选了0个好方法。 ... [详细]
程序员
EFI Shell中没有FS0

如何解决《EFIShell中没有FS0》经验，为你挑选了1个好方法。 ... [详细]

李桂平2402851397

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章