18赞

逐行改进C++的阅读文件？

作者：Gbom2402851125 | 2023-09-09 08:58

如何解决《逐行改进C++的阅读文件？》经验，为你挑选了1个好方法。

我正在解析一个~500GB的日志文件,我的C++版本需要3.5分钟,我的Go版本需要1.2分钟.

我正在使用C++的流来传输文件的每一行以进行解析.

#include 
#include 
#include 

int main( int argc , char** argv ) {
   int linecount = 0 ;
   std::string line ;
   std::ifstream infile( argv[ 1 ] ) ;
   if ( infile ) {
      while ( getline( infile , line ) ) {
          linecount++ ;
      }
      std::cout << linecount << ": " << line << '\n' ;
   }
   infile.close( ) ;
   return 0 ;
}

首先,为什么使用这段代码这么慢？其次,我如何改进它以使其更快？

1> Ralph Tandet..：

iostreams众所周知,C++标准库很慢,标准库的所有不同实现都是这种情况.为什么？因为该标准对实施提出了许多要求,这些要求会抑制最佳性能.标准库的这一部分大约在20年前设计,在高性能基准测试中并不具备真正的竞争力.

你怎么能避免它？使用其他库来实现高性能异步I/O,例如boost asio或操作系统提供的本机功能.

如果您希望保持在标准范围内,该功能std::basic_istream::read()可满足您的性能要求.但在这种情况下,你必须自己进行缓冲和计数.这是如何做到的.

#include 
#include 
#include 
#include 

int main( int, char** argv ) {
   int linecount = 1 ;
   std::vector buffer;
   buffer.resize(1000000); // buffer of 1MB size
   std::ifstream infile( argv[ 1 ] ) ;
   while (infile)
   {
       infile.read( buffer.data(), buffer.size() );
       linecount += std::count( buffer.begin(), 
                                buffer.begin() + infile.gcount(), '\n' );
   }
   std::cout << "linecount: " << linecount << '\n' ;
   return 0 ;
}

让我知道,如果它更快!

推荐阅读

程序员
将背景过滤器应用于svg path元素

如何解决《将背景过滤器应用于svgpath元素》经验，为你挑选了1个好方法。 ... [详细]
程序员
ggplot2:更改条形图中每个构面的颜色

如何解决《ggplot2:更改条形图中每个构面的颜色》经验，为你挑选了1个好方法。 ... [详细]
程序员
Golang:如何在Linux上使用syscall.Syscall？

如何解决《Golang:如何在Linux上使用syscall.Syscall？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何从django rest框架的基于函数的视图中分页响应？

如何解决《如何从djangorest框架的基于函数的视图中分页响应？》经验，为你挑选了1个好方法。 ... [详细]
程序员
解析JSON响应的最简单方法

如何解决《解析JSON响应的最简单方法》经验，为你挑选了3个好方法。 ... [详细]
程序员
Google Feeds API无法正常工作-是否已关闭？

如何解决《GoogleFeedsAPI无法正常工作-是否已关闭？》经验，为你挑选了1个好方法。 ... [详细]
程序员
MATLAB - 获取当前工作空间

如何解决《MATLAB-获取当前工作空间》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么减法超过30天导致错误答案

如何解决《为什么减法超过30天导致错误答案》经验，为你挑选了1个好方法。 ... [详细]
程序员
Chrome DevTools - "排队"在"计时"选项卡中的含义是什么？

如何解决《ChromeDevTools-"排队"在"计时"选项卡中的含义是什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用角度2添加firebase的单元测试

如何解决《使用角度2添加firebase的单元测试》经验，为你挑选了0个好方法。 ... [详细]
程序员
从数组中获取最"流行"的数字

如何解决《从数组中获取最"流行"的数字》经验，为你挑选了1个好方法。 ... [详细]
程序员
在UICollectionViewCell中处理滚动视图大小

如何解决《在UICollectionViewCell中处理滚动视图大小》经验，为你挑选了0个好方法。 ... [详细]
程序员
术语弹性搜索中嵌套字段的聚合

如何解决《术语弹性搜索中嵌套字段的聚合》经验，为你挑选了1个好方法。 ... [详细]
程序员
Linux IRQ处理程序中的固有竞争条件

如何解决《LinuxIRQ处理程序中的固有竞争条件》经验，为你挑选了1个好方法。 ... [详细]
程序员
BlueZ D-Bus C或C++示例

如何解决《BlueZD-BusC或C++示例》经验，为你挑选了1个好方法。 ... [详细]
程序员
C++ - 递归结构 - 它可能吗？

如何解决《C++-递归结构-它可能吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
AngularJS捕获$ http操作的所有状态代码？

如何解决《AngularJS捕获$http操作的所有状态代码？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将字符串转换为size_t

如何解决《将字符串转换为size_t》经验，为你挑选了4个好方法。 ... [详细]
程序员
可重用类库内部的依赖注入（DI）

如何解决《可重用类库内部的依赖注入（DI）》经验，为你挑选了0个好方法。 ... [详细]
程序员
C中的这个操作是什么？

如何解决《C中的这个操作是什么？》经验，为你挑选了1个好方法。 ... [详细]

Gbom2402851125

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章