16赞

python请求bot检测？

作者：罗文彬2502852027 | 2023-08-10 17:36

如何解决《python请求bot检测？》经验，为你挑选了1个好方法。

我一直在使用该requests库来挖掘这个网站.我没有在10分钟内提出太多要求.说25.突然间,网站给了我404错误.

我的问题是:我在某处读到,使用浏览器获取URL与获取类似于某个URL的URL不同requests.因为requests获取不会获得cookie和浏览器的其他内容.是否可以选择requests模拟浏览器,以便服务器不认为我是机器人？或者这不是问题吗？

1> alecxe..：

基本上,你可以做的至少一件事是发送User-Agent标题:

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:20.0) Gecko/20100101 Firefox/20.0'}

response = requests.get(url, headers=headers)

此外requests,您可以使用selenium模拟真实用户- 它使用真正的浏览器 - 在这种情况下,显然没有简单的方法可以区分您的自动用户与其他用户.Selenium也可以使用"无头"浏览器.

另外,检查您正在抓取的网站是否提供了API.如果没有API或您没有使用它,请确保您知道该网站是否真的允许这样的自动网络爬行,研究Terms of use.你知道,在一段时间内请求过多后,他们可能会阻止你.

另见:

使用Python中的Requests库发送"User-agent"

使用Python和PhantomJS进行无头硒测试

推荐阅读

程序员
pytesseract找不到指定的文件

如何解决《pytesseract找不到指定的文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用svg作为背景图像的IE11失败

如何解决《使用svg作为背景图像的IE11失败》经验，为你挑选了4个好方法。 ... [详细]
程序员
即使没有挂起的迁移，Rails迁移也极其缓慢

如何解决《即使没有挂起的迁移，Rails迁移也极其缓慢》经验，为你挑选了0个好方法。 ... [详细]
程序员
PrintFixedDocument wpf打印质量 - Windows 10/8 vs Windows 7

如何解决《PrintFixedDocumentwpf打印质量-Windows10/8vsWindows7》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么我的onClick被调用渲染？ - React.js

如何解决《为什么我的onClick被调用渲染？-React.js》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用基于puppet的引导在EC2实例中设置主机名

如何解决《如何使用基于puppet的引导在EC2实例中设置主机名》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用createPeriodicWave而不是createScriptProcessor和getChannelData

如何解决《如何使用createPeriodicWave而不是createScriptProcessor和getChannelData》经验，为你挑选了0个好方法。 ... [详细]
程序员
Laravel 5：如何基于值saveMany（）

如何解决《Laravel5：如何基于值saveMany（）》经验，为你挑选了1个好方法。 ... [详细]
程序员
'IQueryable'不包含'OrderByDescending'的定义

如何解决《'IQueryable'不包含'OrderByDescending'的定义》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以使用'using'来声明对3个整数类型别名的引用？

如何解决《是否可以使用'using'来声明对3个整数类型别名的引用？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何遍历角度js对象,并将对象添加到循环

如何解决《如何遍历角度js对象,并将对象添加到循环》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用带有有效值的Scanner＃nextDouble的InputMismatchException

如何解决《使用带有有效值的Scanner＃nextDouble的InputMismatchException》经验，为你挑选了1个好方法。 ... [详细]
程序员
jq:打印对象中每个条目的键和值

如何解决《jq:打印对象中每个条目的键和值》经验，为你挑选了2个好方法。 ... [详细]
程序员
找到numpy数组的k个最小值的索引

如何解决《找到numpy数组的k个最小值的索引》经验，为你挑选了2个好方法。 ... [详细]
程序员
Instagram挂钩预选媒体问题

如何解决《Instagram挂钩预选媒体问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以在基类构造函数之前运行成员初始值设定项？

如何解决《是否可以在基类构造函数之前运行成员初始值设定项？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java:带有两个键的HashMap

如何解决《Java:带有两个键的HashMap》经验，为你挑选了1个好方法。 ... [详细]
程序员
纹理包装器不会运行

如何解决《纹理包装器不会运行》经验，为你挑选了0个好方法。 ... [详细]
程序员
MVP Android - 有多少主持人？

如何解决《MVPAndroid-有多少主持人？》经验，为你挑选了2个好方法。 ... [详细]
程序员
JavaScript:如何删除外部数组中的所有方括号？

如何解决《JavaScript:如何删除外部数组中的所有方括号？》经验，为你挑选了1个好方法。 ... [详细]

罗文彬2502852027

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章