如何在django中运行scrapy框架

作者：殉情放开那只小兔子 | 2021-10-20 23:15

这篇文章主要介绍了如何在django中运行scrapy框架,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

1.新建一个django项目，

2.前端展示一个按钮


    {% csrf_token %}

3.在django项目的根目录创建scrapy项目

4.cmd命令行运行：scrapyd 启动服务

5.将scrapy项目部署到当前工程：scrapyd-deploy 爬虫名称 -p 项目名称

6.views.py

# 首页
def index(request):
  return render(request,'index.html',locals())

def start(request):
  if request.method == 'POST':
    # 启动爬虫
    url = 'http://localhost:6800/schedule.json'
    data = {'project': 'ABCkg', 'spider': 'abckg'}
    print(requests.post(url=url, data=data))
    return JsonResponse({'result':'ok'})

7.在本地6800端口点击jobs当前爬虫项目就在运行了。

8.写一个按钮，点击停止scrapy爬虫

def stop(request):
  if request.method == 'POST':
    # 停止爬虫
    url = 'http://127.0.0.1:6800/cancel.json'
    data={"project":'ABCkg','job':'b7fe64ee7ad711e9b711005056c00008'}
    print(requests.post(url=url, data=data))
    return JsonResponse({'result':'stop'})

总结：

----------------scrapyd 管理----------------------

1、获取状态

http://127.0.0.1:6800/daemonstatus.json

2、获取项目列表

http://127.0.0.1:6800/listprojects.json

3、获取项目下已发布的爬虫列表

http://127.0.0.1:6800/listspiders.json?project=myproject

4、获取项目下已发布的爬虫版本列表

http://127.0.0.1:6800/listversions.json?project=myproject

5、获取爬虫运行状态

http://127.0.0.1:6800/listjobs.json?project=myproject

6、启动服务器上某一爬虫（必须是已发布到服务器的爬虫)

http://localhost:6800/schedule.json

(post方式，data={"project":myproject,"spider":myspider}）

7、删除某一版本爬虫

http://127.0.0.1:6800/delversion.json -d project=项目名 -d versions

(post方式，data={"project":myproject,"version":myversion}）

8、删除某一工程，包括该工程下的各版本爬虫

http://127.0.0.1:6800/delproject.json

(post方式，data={"project":myproject}）

9、取消爬虫

http://127.0.0.1:6800/cancel.json

(post方式，data={"project":myproject,'job':myjob}）

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

推荐阅读

程序员
std :: merge和equal element order

如何解决《std::merge和equalelementorder》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在json中转储压缩字符串？

如何解决《如何在json中转储压缩字符串？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使此代码更短更正确？(搜索和复制文件)

如何解决《如何使此代码更短更正确？(搜索和复制文件)》经验，为你挑选了1个好方法。 ... [详细]
程序员
在控制器中呈现数据,然后在视图中呈现数据

如何解决《在控制器中呈现数据,然后在视图中呈现数据》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Gradle中隐藏传递依赖？

如何解决《如何在Gradle中隐藏传递依赖？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何检测未引用或双引号的空间

如何解决《如何检测未引用或双引号的空间》经验，为你挑选了0个好方法。 ... [详细]
程序员
不能将vector作为参数c ++传递

如何解决《不能将vector作为参数c++传递》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Swift在Xcode 7.1.1下"使用优化编译了Realm"

如何解决《使用Swift在Xcode7.1.1下"使用优化编译了Realm"》经验，为你挑选了1个好方法。 ... [详细]
程序员
React - react.render上的未处理错误事件()

如何解决《React-react.render上的未处理错误事件()》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Swift中使用两个闭包作为参数创建函数？

如何解决《如何在Swift中使用两个闭包作为参数创建函数？》经验，为你挑选了1个好方法。 ... [详细]
程序员
我的<circle>在哪里？

如何解决《我的<circle>在哪里？》经验，为你挑选了1个好方法。 ... [详细]
程序员
程序获取(项目:输出字符串); (在一个函数中)

如何解决《程序获取(项目:输出字符串);(在一个函数中)》经验，为你挑选了1个好方法。 ... [详细]
程序员
检查scanf的输入

如何解决《检查scanf的输入》经验，为你挑选了1个好方法。 ... [详细]
程序员
在条件中分配多个val

如何解决《在条件中分配多个val》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Python 3.x中更改了`__rdiv __()`和`__idiv__`运算符？

如何解决《在Python3.x中更改了`__rdiv__()`和`__idiv__`运算符？》经验，为你挑选了1个好方法。 ... [详细]
程序员
git拉在另一个分支上

如何解决《git拉在另一个分支上》经验，为你挑选了2个好方法。 ... [详细]
程序员
宝石更新后:测试失败,"资产未声明在生产中预编译"

如何解决《宝石更新后:测试失败,"资产未声明在生产中预编译"》经验，为你挑选了3个好方法。 ... [详细]
程序员
Oozie:从Oozie <java>行动中启动Map-Reduce？

如何解决《Oozie:从Oozie<java>行动中启动Map-Reduce？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何解释Azure VM的instanceView的状态？

如何解决《如何解释AzureVM的instanceView的状态？》经验，为你挑选了0个好方法。 ... [详细]
程序员
django.db.utils.OperationalError:(1046,'没有选择数据库')

如何解决《django.db.utils.OperationalError:(1046,'没有选择数据库')》经验，为你挑选了1个好方法。 ... [详细]

殉情放开那只小兔子

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章