5赞

抓取https://www.thenewboston.com/时出现"SSL:certificate_verify_failed"错误

作者：k78283381 | 2023-09-09 03:49

如何解决《抓取https://www.thenewboston.com/时出现"SSL:certificate_verify_failed"错误》经验，为你挑选了3个好方法。

所以我最近在youtube上使用"新波士顿"视频开始学习Python,一切都很顺利,直到我开始制作一个简单的网络爬虫教程.虽然我理解它没有问题,但当我运行代码时,我得到的错误似乎都基于"SSL:CERTIFICATE_VERIFY_FAILED".自昨晚以来我一直在寻找答案,试图弄清楚如何修复它,似乎没有其他人在视频或他的网站上的评论中遇到与我相同的问题,甚至使用他的某些人的代码网站我得到了相同的结果.我将从网站上发布的代码发布代码,因为它给了我同样的错误,而我编码的代码现在变得一团糟.

import requests
from bs4 import BeautifulSoup

def trade_spider(max_pages):
    page = 1
    while page <= max_pages:
        url = "https://www.thenewboston.com/forum/category.php?id=15&orderby=recent&page=" + str(page) #this is page of popular posts
        source_code = requests.get(url)
        # just get the code, no headers or anything
        plain_text = source_code.text
        # BeautifulSoup objects can be sorted through easy
        for link in soup.findAll('a', {'class': 'index_singleListingTitles'}): #all links, which contains "" class='index_singleListingTitles' "" in it.
            href = "https://www.thenewboston.com/" + link.get('href')
            title = link.string # just the text, not the HTML
            print(href)
            print(title)
            # get_single_item_data(href)
    page += 1
trade_spider(1)

完整的错误是: ssl.SSLError: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:645)

如果这是一个愚蠢的问题我很抱歉,我仍然是编程的新手,但我真的无法弄清楚这一点,我正在考虑跳过这个教程,但是我无法解决这个问题,谢谢!

1> mattexx..：

您可以告诉请求不要验证SSL证书:

>>> url = "https://www.thenewboston.com/forum/category.php?id=15&orderby=recent&page=1"
>>> response = requests.get(url, verify=False)
>>> response.status_code
200

在文档中查看更多内容requests

关闭验证通常是一个糟糕的建议,因为它通过使应用程序不安全来解决问题.证书得到验证是有原因的(在中间攻击中防止人员).因此,虽然这可能是**仅用于测试**的工作,但您不应该在生产代码中执行此操作.最好的方法是学习如何正确解决问题,而不是如何以不安全的方式解决问题.

2> Steffen Ullr..：

问题不在您的代码中,而是在您尝试访问的网站中.在查看SSLLabs的分析时,您会注意到:

此服务器的证书链不完整.等级上限为B.

这意味着服务器配置是错误的,不仅python而且其他几个都会遇到此站点的问题.某些桌面浏览器通过尝试从Internet加载缺少的证书或使用缓存的证书填写来解决此配置问题.但是其他浏览器或应用程序也会失败,类似于python.

要解决损坏的服务器配置,您可以显式提取缺少的证书并将其添加到信任存储区.或者您可以在verify参数中将证书作为trust.从文档:

您可以使用受信任CA的证书验证路径到CA_BUNDLE文件或目录:
>>> requests.get('https://github.com', verify='/path/to/certfile') 
此可信CA的列表也可以通过REQUESTS_CA_BUNDLE环境变量指定.

3> markhor..：

您可能缺少系统中的库存证书.例如,如果在Ubuntu上运行,请检查ca-certificates是否已安装该软件包.

推荐阅读

程序员
如何在STS中使用Apache Tomcat 8(Spring Tool Suite最新版本)？

如何解决《如何在STS中使用ApacheTomcat8(SpringToolSuite最新版本)？》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用SymPy将符号表达式转换为Python函数

如何解决《使用SymPy将符号表达式转换为Python函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在materilize CSS中控制自动打开的Datepicker？

如何解决《如何在materilizeCSS中控制自动打开的Datepicker？》经验，为你挑选了1个好方法。 ... [详细]
程序员
SIP代理和SIP出站代理之间的区别

如何解决《SIP代理和SIP出站代理之间的区别》经验，为你挑选了0个好方法。 ... [详细]
程序员
C＃创建Excel工作表后期绑定

如何解决《C＃创建Excel工作表后期绑定》经验，为你挑选了1个好方法。 ... [详细]
程序员
在android studio中有没有一种方法来禁用模块而不删除它？

如何解决《在androidstudio中有没有一种方法来禁用模块而不删除它？》经验，为你挑选了1个好方法。 ... [详细]
程序员
打开jenkins.war时出错

如何解决《打开jenkins.war时出错》经验，为你挑选了2个好方法。 ... [详细]
程序员
网站如何知道他们不是默认的主页或搜索提供商？

如何解决《网站如何知道他们不是默认的主页或搜索提供商？》经验，为你挑选了3个好方法。 ... [详细]
程序员
ios-deploy无法在Mac OS X El Capitan 10.11上安装

如何解决《ios-deploy无法在MacOSXElCapitan10.11上安装》经验，为你挑选了2个好方法。 ... [详细]
程序员
我们能否从他们的限制中推断出两个阶级的关系？

如何解决《我们能否从他们的限制中推断出两个阶级的关系？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Ext.MessageBox.confirm自定义按钮

如何解决《Ext.MessageBox.confirm自定义按钮》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在没有调用onCreate()的情况下返回First活动

如何解决《如何在没有调用onCreate()的情况下返回First活动》经验，为你挑选了1个好方法。 ... [详细]
程序员
Mongo中findOne和find_one有什么区别？

如何解决《Mongo中findOne和find_one有什么区别？》经验，为你挑选了1个好方法。 ... [详细]
程序员
当提交足够的任务时,修复了线程池线程阻塞

如何解决《当提交足够的任务时,修复了线程池线程阻塞》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在pyspark中找到两个rdd的交叉点？

如何解决《如何在pyspark中找到两个rdd的交叉点？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么以下函数不是尾递归？

如何解决《为什么以下函数不是尾递归？》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否有适用于AWS Lambda的模拟器？

如何解决《是否有适用于AWSLambda的模拟器？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在迁移层5.1中设置自动增量字段开始表单1000

如何解决《在迁移层5.1中设置自动增量字段开始表单1000》经验，为你挑选了3个好方法。 ... [详细]
程序员
std :: string :: assign vs std :: string :: operator =

如何解决《std::string::assignvsstd::string::operator=》经验，为你挑选了1个好方法。 ... [详细]
程序员
未找到AngularJS控制器,未定义

如何解决《未找到AngularJS控制器,未定义》经验，为你挑选了0个好方法。 ... [详细]

k78283381

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章