17赞

你如何在python中解压缩非常大的文件？

作者：mobiledu2402851323 | 2023-09-02 12:00

如何解决《你如何在python中解压缩非常大的文件？》经验，为你挑选了2个好方法。

使用python 2.4和内置ZipFile库,我无法读取非常大的zip文件(大于1或2 GB),因为它想要将未压缩文件的全部内容存储在内存中.有没有其他方法可以做到这一点(使用第三方库或其他一些黑客),或者我必须"解决"并以这种方式解压缩(显然不是跨平台).

1> S.Lott..：

这是大文件解压缩的概述.

import zipfile
import zlib
import os

src = open( doc, "rb" )
zf = zipfile.ZipFile( src )
for m in  zf.infolist():

    # Examine the header
    print m.filename, m.header_offset, m.compress_size, repr(m.extra), repr(m.comment)
    src.seek( m.header_offset )
    src.read( 30 ) # Good to use struct to unpack this.
    nm= src.read( len(m.filename) )
    if len(m.extra) > 0: ex= src.read( len(m.extra) )
    if len(m.comment) > 0: cm= src.read( len(m.comment) ) 

    # Build a decompression object
    decomp= zlib.decompressobj(-15)

    # This can be done with a loop reading blocks
    out= open( m.filename, "wb" )
    result= decomp.decompress( src.read( m.compress_size ) )
    out.write( result )
    result = decomp.flush()
    out.write( result )
    # end of the loop
    out.close()

zf.close()
src.close()

@ s-lott什么是`ex = src.read(len(m.extra))`和`cm = src.read(len(m.comment))`你用什么变量`ex`和`cm`对于？你是什么意思使用结构解压缩它是好的？用什么神奇数字`30`？

2> Martijn Piet..：

从Python 2.6开始,您可以使用ZipFile.open()在文件上打开文件句柄,并将内容有效地复制到您选择的目标文件中:

import errno
import os
import shutil
import zipfile

TARGETDIR = '/foo/bar/baz'

with open(doc, "rb") as zipsrc:
    zfile = zipfile.ZipFile(zipsrc)
    for member in zfile.infolist():
       target_path = os.path.join(TARGETDIR, member.filename)
       if target_path.endswith('/'):  # folder entry, create
           try:
               os.makedirs(target_path)
           except (OSError, IOError) as err:
               # Windows may complain if the folders already exist
               if err.errno != errno.EEXIST:
                   raise
           continue
       with open(target_path, 'wb') as outfile, zfile.open(member) as infile:
           shutil.copyfileobj(infile, outfile)

这用于shutil.copyfileobj()有效地从打开的zipfile对象读取数据,将其复制到输出文件.

推荐阅读

程序员
'frozenset'对象不可调用

如何解决《'frozenset'对象不可调用》经验，为你挑选了1个好方法。 ... [详细]
程序员
查看VSTF构建中的git-lfs文件

如何解决《查看VSTF构建中的git-lfs文件》经验，为你挑选了2个好方法。 ... [详细]
程序员
RewriteRule无法在生产服务器上运行

如何解决《RewriteRule无法在生产服务器上运行》经验，为你挑选了0个好方法。 ... [详细]
程序员
在移动设备的HTML电子邮件中使用vw(视口宽度)的字体大小是否可以

如何解决《在移动设备的HTML电子邮件中使用vw(视口宽度)的字体大小是否可以》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何从Visual Studio 2015 C++项目导出Makefile

如何解决《如何从VisualStudio2015C++项目导出Makefile》经验，为你挑选了0个好方法。 ... [详细]
程序员
PHP7 Laravel Mcrypt问题

如何解决《PHP7LaravelMcrypt问题》经验，为你挑选了4个好方法。 ... [详细]
程序员
嵌套Scrollview + Recycler View

如何解决《嵌套Scrollview+RecyclerView》经验，为你挑选了0个好方法。 ... [详细]
程序员
PHP数组元素总和

如何解决《PHP数组元素总和》经验，为你挑选了1个好方法。 ... [详细]
程序员
标准库中是否定义了标准输入,输出和错误描述符常量？

如何解决《标准库中是否定义了标准输入,输出和错误描述符常量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将单词拆分为双字节,包括重复单词？

如何解决《如何将单词拆分为双字节,包括重复单词？》经验，为你挑选了2个好方法。 ... [详细]
程序员
为什么CompletableFuture.allOf声明为CompletableFuture <Void>？

如何解决《为什么CompletableFuture.allOf声明为CompletableFuture<Void>？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在matlab中合并两个不同维度的矩阵

如何解决《如何在matlab中合并两个不同维度的矩阵》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在不破坏localStorage类型的情况下存储和获取对象？

如何解决《如何在不破坏localStorage类型的情况下存储和获取对象？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将Fody.PropertyChanged与MVVMCross一起使用是否安全？是否降低了应用程序的性能？

如何解决《将Fody.PropertyChanged与MVVMCross一起使用是否安全？是否降低了应用程序的性能？》经验，为你挑选了1个好方法。 ... [详细]
程序员
从一系列较小的实例中推断出一般的类型类实例？

如何解决《从一系列较小的实例中推断出一般的类型类实例？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将TransactionScope与实体框架6一起使用

如何解决《将TransactionScope与实体框架6一起使用》经验，为你挑选了1个好方法。 ... [详细]
程序员
Flask中的WTForms:UndefinedError:'form'未定义

如何解决《Flask中的WTForms:UndefinedError:'form'未定义》经验，为你挑选了1个好方法。 ... [详细]
程序员
Mysql查询组Concat在单个查询中限制子表的多个记录

如何解决《Mysql查询组Concat在单个查询中限制子表的多个记录》经验，为你挑选了0个好方法。 ... [详细]
程序员
xDB不存储任何交互

如何解决《xDB不存储任何交互》经验，为你挑选了1个好方法。 ... [详细]
程序员
android.animation和android.transition包之间的主要区别是什么？

如何解决《android.animation和android.transition包之间的主要区别是什么？》经验，为你挑选了0个好方法。 ... [详细]

mobiledu2402851323

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章