16赞

Scrapy:没有标题的CSV输出

作者：家具销售_903 | 2023-09-09 09:47

如何解决《Scrapy:没有标题的CSV输出》经验，为你挑选了1个好方法。

当我使用该命令时scrapy crawl -o ,我得到Item带有标题的字典输出.这很好.但是,如果文件已存在,我希望scrapy省略标题.scrapy能够做到这一点还是我需要实现该功能？

1> furas..：

有include_headers_line=True,CsvItemExporter但我不知道如何直接使用它.http://doc.scrapy.org/en/latest/topics/exporters.html#csvitemexporter

但您可以include_headers_line=False在文件中创建自己的导出器exporters.py(与settings.pyand 相同的文件夹items.py)

from scrapy.exporters import CsvItemExporter


class HeadlessCsvItemExporter(CsvItemExporter):

    def __init__(self, *args, **kwargs):
        kwargs['include_headers_line'] = False
        super(HeadlessCsvItemExporter, self).__init__(*args, **kwargs)

然后你必须设置这个导出器 settings.py

FEED_EXPORTERS = {
    'csv': 'your_project_name.exporters.HeadlessCsvItemExporter',
}

现在scrapy应该写所有没有标题的csv文件.

scrapy crawl  -o

或者你可以设置

FEED_EXPORTERS = {
    'headless': 'your_project_name.exporters.HeadlessCsvItemExporter',
}

只有在使用时才能获得没有标题的csv -t headless

scrapy crawl  -o  -t headless

PS.别忘了到位的使用您的项目名称your_project_name中setttings.py

编辑:

现在导出器仅在文件不为空时跳过标题(如果file.tell() > 0)

from scrapy.exporters import CsvItemExporter


class HeadlessCsvItemExporter(CsvItemExporter):

    def __init__(self, *args, **kwargs):

        # args[0] is (opened) file handler
        # if file is not empty then skip headers
        if args[0].tell() > 0:
            kwargs['include_headers_line'] = False

        super(HeadlessCsvItemExporter, self).__init__(*args, **kwargs)

推荐阅读

程序员
浏览器同步未使用代理加载ASP.NET 5网站

如何解决《浏览器同步未使用代理加载ASP.NET5网站》经验，为你挑选了0个好方法。 ... [详细]
程序员
cakephp 3编辑用户用户名和密码 - 无法找到当前实体的表类

如何解决《cakephp3编辑用户用户名和密码-无法找到当前实体的表类》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用CodeIgniter http:// :: 1/codeigniter /在html源代码中的IP地址显示在表单操作中

如何解决《使用CodeIgniterhttp://::1/codeigniter/在html源代码中的IP地址显示在表单操作中》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何使用Matplotlib颤动刻度

如何解决《如何使用Matplotlib颤动刻度》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用C++ 14和C++ 1z中的功能缩短这个可变参数模板代码？

如何解决《如何使用C++14和C++1z中的功能缩短这个可变参数模板代码？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何从包含的片段控制活动的向上按钮？

如何解决《如何从包含的片段控制活动的向上按钮？》经验，为你挑选了1个好方法。 ... [详细]
程序员
SSIS 2012日期格式为dmy vs mdy

如何解决《SSIS2012日期格式为dmyvsmdy》经验，为你挑选了0个好方法。 ... [详细]
程序员
NPM无法在OSX 10.9.5上安装zmq

如何解决《NPM无法在OSX10.9.5上安装zmq》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在不使用链接的情况下在Drupal 8中打开模态？

如何解决《如何在不使用链接的情况下在Drupal8中打开模态？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Gulp从SASS/SCSS中缩小和自动修复CSS文件

如何解决《如何使用Gulp从SASS/SCSS中缩小和自动修复CSS文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将变量和文件传递给perl -p -e命令

如何解决《如何将变量和文件传递给perl-p-e命令》经验，为你挑选了1个好方法。 ... [详细]
程序员
Spree Guest电子邮件已保存

如何解决《SpreeGuest电子邮件已保存》经验，为你挑选了0个好方法。 ... [详细]
程序员
Spark中的嵌套JSON

如何解决《Spark中的嵌套JSON》经验，为你挑选了1个好方法。 ... [详细]
程序员
对和值之间的Java映射

如何解决《对和值之间的Java映射》经验，为你挑选了1个好方法。 ... [详细]
程序员
OpenID Connect Providers是否加密然后签署他们的JWT？

如何解决《OpenIDConnectProviders是否加密然后签署他们的JWT？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用ES6时,如何在一个文件中定义导入的函数,而在另一个文件中不定义？

如何解决《使用ES6时,如何在一个文件中定义导入的函数,而在另一个文件中不定义？》经验，为你挑选了2个好方法。 ... [详细]
程序员
openshift让我们加密证书

如何解决《openshift让我们加密证书》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用协议将案例添加到现有枚举

如何解决《使用协议将案例添加到现有枚举》经验，为你挑选了3个好方法。 ... [详细]
程序员
多项任务混淆

如何解决《多项任务混淆》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Core Data中存储Swift值类型

如何解决《在CoreData中存储Swift值类型》经验，为你挑选了1个好方法。 ... [详细]

家具销售_903

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章