2赞

Python线程stack_size和segfaults

作者：有风吹过best | 2023-09-01 15:58

如何解决《Python线程stack_size和segfaults》经验，为你挑选了1个好方法。

一个Web爬虫脚本,最多可生成500个线程,每个线程基本上都会请求从远程服务器提供的某些数据,每个服务器的回复在内容和大小上与其他服务器不同.

我正在为线程设置stack_size为756K

threading.stack_size(756*1024)

这使我能够拥有足够数量的线程并完成大部分工作和请求.但是由于某些服务器的响应比其他服务器更大,并且当线程得到那种响应时,脚本会死于SIGSEGV.

stack_sizes超过756K使得无法同时拥有所需数量的线程.

关于如何在没有崩溃的情况下继续使用给定的stack_size的任何建议？以及如何获得任何给定线程的当前使用的stack_size？

1> nosklo..：

为什么你要产生500个线程呢？这似乎是个糟糕的主意!

完全删除线程,使用事件循环进行爬网.您的程序将更快,更简单,更易于维护.

等待网络的大量线程不会使您的程序等待更快.相反,收集列表中的所有打开的套接字并运行一个循环,检查是否有任何数据可用.

我建议使用Twisted - 它是一个事件驱动的网络引擎.它非常灵活,安全,可扩展且非常稳定(没有段错误).

您还可以看一下Scrapy - 它是一个用Python/Twisted编写的网页抓取和屏幕抓取框架.它仍处于重大发展阶段,但也许你可以采取一些想法.

推荐阅读

程序员
如何合并两个分支,并自动忽略特定的文件/文件夹？

如何解决《如何合并两个分支,并自动忽略特定的文件/文件夹？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用Docker部署到生产中:零停机时间

如何解决《使用Docker部署到生产中:零停机时间》经验，为你挑选了1个好方法。 ... [详细]
程序员
React + Redux-router =未捕获错误:期望reducer成为一个函数

如何解决《React+Redux-router=未捕获错误:期望reducer成为一个函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
内存分配到字符串对象？

如何解决《内存分配到字符串对象？》经验，为你挑选了1个好方法。 ... [详细]
程序员
ScrollView未显示第一个项目

如何解决《ScrollView未显示第一个项目》经验，为你挑选了1个好方法。 ... [详细]
程序员
用于参数检查和其他偏执狂的常见Lisp习语？

如何解决《用于参数检查和其他偏执狂的常见Lisp习语？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用wifi直接和使用wifi热点共享文件之间的区别

如何解决《使用wifi直接和使用wifi热点共享文件之间的区别》经验，为你挑选了0个好方法。 ... [详细]
程序员
如果没有第二次调用服务器,请求确认IdentityServer 3不支持自定义声明

如何解决《如果没有第二次调用服务器,请求确认IdentityServer3不支持自定义声明》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何通过子树合并将git存储库与子模块合并到另一个子模块中？

如何解决《如何通过子树合并将git存储库与子模块合并到另一个子模块中？》经验，为你挑选了0个好方法。 ... [详细]
程序员
不能将字符串数组声明为类成员

如何解决《不能将字符串数组声明为类成员》经验，为你挑选了1个好方法。 ... [详细]
程序员
在matlab中运行矩阵的均值

如何解决《在matlab中运行矩阵的均值》经验，为你挑选了1个好方法。 ... [详细]
程序员
警告"使用构建变体包中的属性"是什么意思？

如何解决《警告"使用构建变体包中的属性"是什么意思？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用相同的配置部署多个Content Delivery Server

如何解决《使用相同的配置部署多个ContentDeliveryServer》经验，为你挑选了1个好方法。 ... [详细]
程序员
Hamcrest匹配器比较JSON的双值

如何解决《Hamcrest匹配器比较JSON的双值》经验，为你挑选了0个好方法。 ... [详细]
程序员
d3.select.style没有在firefox上工作

如何解决《d3.select.style没有在firefox上工作》经验，为你挑选了1个好方法。 ... [详细]
程序员
单击动态生成的跨度

如何解决《单击动态生成的跨度》经验，为你挑选了1个好方法。 ... [详细]
程序员
Play framework 2.4:NoClassDefFoundError:play/api/cache/CachePlugin

如何解决《Playframework2.4:NoClassDefFoundError:play/api/cache/CachePlugin》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么nullptr_t不是关键字

如何解决《为什么nullptr_t不是关键字》经验，为你挑选了1个好方法。 ... [详细]
程序员
C#:为什么x的最终值与for循环外的值不同？

如何解决《C#:为什么x的最终值与for循环外的值不同？》经验，为你挑选了1个好方法。 ... [详细]

有风吹过best

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章