当前位置:  开发笔记 > 编程语言 > 正文

如何将大型tar.gz文件的内容传递给STDOUT?

如何解决《如何将大型tar.gz文件的内容传递给STDOUT?》经验,为你挑选了1个好方法。

我有一个large.tar.gz包含大约100万个文件的文件,其中大约1/4是html文件,我想解析其中每个html文件的几行.

我想避免必须将大量的内容解压缩large.tar.gz到一个文件夹,然后解析html文件,而我想知道如何在large.tar.gz直接管道html文件的内容,STDOUT以便我可以grep /解析出来我想要他们的信息?

我认为必须有一些魔术:

tar -special_flags large.tar.gz | grep_only_files_with_extension html | xargs -n1 head -n 99999 | ./parse_contents.pl -

有任何想法吗?



1> Cyrus..:

将此与GNU tar一起使用以将tgz提取到stdout:

tar -xOzf large.tar.gz --wildcards '*.html' | grep ...

-O, --to-stdout:将文件提取到标准输出

推荐阅读
sx-March23
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有