我有超过一百万个文本文件压缩成40个zip文件.我还有一个大约500个手机型号名单.我想找出文本文件中提到的特定模型的次数.
是否有任何python模块可以对文件进行正则表达式匹配而不解压缩它.有没有解压这个问题的简单方法而不解压缩?
什么都不会自动做你想要的.
但是,有一个python zipfile模块可以让这很容易.这是如何迭代文件中的行.
#!/usr/bin/python import zipfile f = zipfile.ZipFile('myfile.zip') for subfile in f.namelist(): print subfile data = f.read(subfile) for line in data.split('\n'): print line