18赞

从Scrapy管道发出非阻塞HTTP请求

作者：拾味湖 | 2023-09-07 13:40

如何解决《从Scrapy管道发出非阻塞HTTP请求》经验，为你挑选了1个好方法。

据我了解,Scrapy是单线程但在网络端异步.我正在开发一些需要从项目管道中对外部资源进行API调用的东西.有没有办法在不阻塞管道的情况下发出HTTP请求并减慢Scrapy的爬行速度？

谢谢

1> Granitosauru..：

您可以通过直接将请求安排到crawler.enginevia来完成crawler.engine.crawl(request, spider).但要做到这一点,你需要在管道中公开爬虫:

class MyPipeline(object):
    def __init__(self, crawler):
        self.crawler = crawler

    @classmethod
    def from_crawler(cls, crawler):
        return cls(crawler)

    def process_item(self, item, spider):
        if item['some_extra_field']:  # check if we already did below
            return item
        url = 'some_url'
        req = scrapy.Request(url, self.parse_item, meta={'item':item})
        self.crawler.engine.crawl(req, spider)
        raise DropItem()  # we will get this item next time

    def parse_item(self, response):
        item = response.meta['item']
        item['some_extra_field'] = '...'
        return item

推荐阅读

程序员
$ document_root变量不能在"root"指令中使用

如何解决《$document_root变量不能在"root"指令中使用》经验，为你挑选了1个好方法。 ... [详细]
程序员
在php中排序依赖的子数组

如何解决《在php中排序依赖的子数组》经验，为你挑选了0个好方法。 ... [详细]
程序员
C++通过变量的连接名称获取变量值

如何解决《C++通过变量的连接名称获取变量值》经验，为你挑选了1个好方法。 ... [详细]
程序员
EPROTO:使用ember new时的协议错误,符号链接'../semver/bin/semver'

如何解决《EPROTO:使用embernew时的协议错误,符号链接'../semver/bin/semver'》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Typescript前端和NodeJ后端之间共享js对象的最佳方法

如何解决《在Typescript前端和NodeJ后端之间共享js对象的最佳方法》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用f1作为评分函数的网格搜索,几页错误消息

如何解决《使用f1作为评分函数的网格搜索,几页错误消息》经验，为你挑选了1个好方法。 ... [详细]
程序员
adb reboot挂起Gennymotion

如何解决《adbreboot挂起Gennymotion》经验，为你挑选了1个好方法。 ... [详细]
程序员
ElasticSearch:inner_hits和hightlight_query

如何解决《ElasticSearch:inner_hits和hightlight_query》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何设置Paper.js画布背景填充颜色（无CSS背景）

如何解决《如何设置Paper.js画布背景填充颜色（无CSS背景）》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何通过NFC标签启动我的应用程序？

如何解决《如何通过NFC标签启动我的应用程序？》经验，为你挑选了1个好方法。 ... [详细]
程序员
加速REST API服务Laravel 5

如何解决《加速RESTAPI服务Laravel5》经验，为你挑选了2个好方法。 ... [详细]
程序员
在mvc 5项目中使用角度指令模板url中的html文件

如何解决《在mvc5项目中使用角度指令模板url中的html文件》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用Moment.js获取月份名称

如何解决《使用Moment.js获取月份名称》经验，为你挑选了2个好方法。 ... [详细]
程序员
从列表中的多个列表中删除Null

如何解决《从列表中的多个列表中删除Null》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java反射:从实现类中获取通用接口的类型参数

如何解决《Java反射:从实现类中获取通用接口的类型参数》经验，为你挑选了1个好方法。 ... [详细]
程序员
SCORM 1.2和SCORM 2004之间的区别

如何解决《SCORM1.2和SCORM2004之间的区别》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法添加文件,不能添加git存储库

如何解决《无法添加文件,不能添加git存储库》经验，为你挑选了1个好方法。 ... [详细]
程序员
jpeg的有效base64字符串

如何解决《jpeg的有效base64字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
UIWebView在loadRequest上调整大小

如何解决《UIWebView在loadRequest上调整大小》经验，为你挑选了0个好方法。 ... [详细]
程序员
Hive作业失败,返回代码为1,来自org.apache.hadoop.hive.ql.exec.tez.TezTask和查询性能

如何解决《Hive作业失败,返回代码为1,来自org.apache.hadoop.hive.ql.exec.tez.TezTask和查询性能》经验，为你挑选了0个好方法。 ... [详细]

拾味湖

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章