13赞

Python中的多线程爬虫是否真的加快了速度？

作者：凹凸曼00威威_694 | 2023-07-10 12:24

如何解决《Python中的多线程爬虫是否真的加快了速度？》经验，为你挑选了2个好方法。

期待在python中编写一个小的web爬虫.我开始研究将其编写为多线程脚本,一个线程下载池和一个池处理结果.由于GIL它实际上会同时下载吗？GIL如何影响网络爬虫？每个线程都会从套接字中选择一些数据,然后转到下一个线程,让它从套接字中选择一些数据等等.

基本上我要问的是在python中做一个多线程爬虫真的会给我带来很多性能vs单线程？

谢谢!

1> Greg Hewgill..：

执行网络操作时,Python解释器不会保留GIL.如果您正在进行网络绑定的工作(如爬虫),则可以安全地忽略GIL的影响.

另一方面,如果您创建了许多正在处理的线程(下载后),您可能需要测量性能.限制线程数将减少GIL对您的性能的影响.

2> nosklo..：

看看scrapy的工作原理.它可以帮到你很多.它不使用线程,但可以在同一个线程中进行多个"同时"下载.

如果你考虑一下,你只有一个网卡,所以并行处理无法真正帮助定义.

scrapy所做的只是在发送另一个请求之前不等待一个请求的响应.全部在一个线程中.

推荐阅读

程序员
无法使用sequelize连接到SQL Azure数据库,但localhost上的SQL Server工作正常

如何解决《无法使用sequelize连接到SQLAzure数据库,但localhost上的SQLServer工作正常》经验，为你挑选了1个好方法。 ... [详细]
程序员
通用Windows应用商店应用关闭时如何执行代码？

如何解决《通用Windows应用商店应用关闭时如何执行代码？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何等待async void完成？

如何解决《如何等待asyncvoid完成？》经验，为你挑选了1个好方法。 ... [详细]
程序员
routes.LowercaseUrls和routes.AppendTrailingSlash在MVC中不起作用

如何解决《routes.LowercaseUrls和routes.AppendTrailingSlash在MVC中不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用swiftmailer发送多封电子邮件时如何绕过失败的电子邮件？

如何解决《使用swiftmailer发送多封电子邮件时如何绕过失败的电子邮件？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Django:什么是权限代号？

如何解决《Django:什么是权限代号？》经验，为你挑选了1个好方法。 ... [详细]
程序员
从旧字典键生成新的字典键

如何解决《从旧字典键生成新的字典键》经验，为你挑选了1个好方法。 ... [详细]
程序员
nltk StanfordNERTagger:NoClassDefFoundError:org/slf4j/LoggerFactory(在Windows中)

如何解决《nltkStanfordNERTagger:NoClassDefFoundError:org/slf4j/LoggerFactory(在Windows中)》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Python的Windows桌面GUI自动化 - 睡眠与紧密循环

如何解决《使用Python的Windows桌面GUI自动化-睡眠与紧密循环》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Google Maps API旋转SVG符号以匹配飞机航向

如何解决《使用GoogleMapsAPI旋转SVG符号以匹配飞机航向》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用值而不是索引从Python列表中进行选择

如何解决《使用值而不是索引从Python列表中进行选择》经验，为你挑选了1个好方法。 ... [详细]
程序员
MATLAB中阈值内的最小二乘最小化

如何解决《MATLAB中阈值内的最小二乘最小化》经验，为你挑选了0个好方法。 ... [详细]
程序员
System.out.println在Play Framework控制台中按顺序打印

如何解决《System.out.println在PlayFramework控制台中按顺序打印》经验，为你挑选了0个好方法。 ... [详细]
程序员
根据foldr验证foldl实现

如何解决《根据foldr验证foldl实现》经验，为你挑选了1个好方法。 ... [详细]
程序员
Outlook关闭时,为什么Excel VBA运行速度明显加快？

如何解决《Outlook关闭时,为什么ExcelVBA运行速度明显加快？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在Javascript中将UTC/GMT日期时间转换为CST？(不是本地的,CST总是)

如何解决《如何在Javascript中将UTC/GMT日期时间转换为CST？(不是本地的,CST总是)》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么LocationSettingsResult startResolutionForResult没有调用onActivityResult？

如何解决《为什么LocationSettingsResultstartResolutionForResult没有调用onActivityResult？》经验，为你挑选了2个好方法。 ... [详细]
程序员
保存录制的音频(Swift)

如何解决《保存录制的音频(Swift)》经验，为你挑选了1个好方法。 ... [详细]
程序员
AWS Lambda通过cloudformation安排事件源

如何解决《AWSLambda通过cloudformation安排事件源》经验，为你挑选了3个好方法。 ... [详细]
程序员
[iOS]:检测视图控制器何时从另一个外部应用程序返回后出现

如何解决《[iOS]:检测视图控制器何时从另一个外部应用程序返回后出现》经验，为你挑选了1个好方法。 ... [详细]

凹凸曼00威威_694

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章