15赞

Python爬虫库requests获取响应内容、响应状态码、响应头

作者：雨天是最美 | 2022-01-26 04:24

上一节我们给大家介绍了Python爬虫库requests的发送请求传参等使用方法，今天为大家介绍下requests获取响应内容、响应状态码、响应头等相关信息

首先在程序中引入Requests模块

import requests

一、获取不同类型的响应内容

在发送请求后，服务器会返回一个响应内容，而且requests通常会自动解码响应内容

1.文本响应内容

获取文本类型的响应内容

r = requests.get('https://www.baidu.com')
r.text # 通过文本的形式获取响应内容

'\r\n ç\x99¾åo|ä¸\x80ä¸\x8bï¼\x8cä½\xa0å°±ç\x9f￥é\x81\x93         
        
 
 
  æ\x96°é\x97» hao123 å\x9c°å\x9b¾ è§\x86é￠\x91 è′′å\x90§   æ\x9b′å¤\x9aäo§å\x93\x81 
 
 
    å\x853äo\x8eç\x99¾åo| About Baidu 
 ©2017 Baidu ä½¿ç\x94¨ç\x99¾åo|å\x89\x8då¿\x85èˉ»  æ\x84\x8fè§\x81å\x8f\x8dé|\x88 äo¬ICPèˉ\x81030173å\x8f·   
 
 
 
  \r\n'

通过encoding来获取响应内容的编码以及修改编码

r.encoding

'ISO-8859-1'

2.二进制响应内容

r.content # 通过content获取的内容便是二进制类型的

3.JSON响应内容

r.json()

4.原始响应内容

r = requests.get('https://www.baidu.com',stream=True)
print(r.raw) # 就是urllib中的HTTPResponse对象
print(r.raw.read(10))


b'\x1f\x8b\x08\x00\x00\x00\x00\x00\x00\x03'

二、响应状态码

获取响应状态码

r = requests.get('https://www.baidu.com')
r.status_code

判断响应状态码

r.status_code == requests.codes.ok

True

当发送一个错误请求时，抛出异常

bad_r = requests.get('http://httpbin.org/status/404')
print(bad_r.status_code)
bad_r.raise_for_status()

404



---------------------------------------------------------------------------

HTTPError                 Traceback (most recent call last)

 in ()
   1 bad_r = requests.get('http://httpbin.org/status/404')
   2 print(bad_r.status_code)
----> 3 bad_r.raise_for_status()


D:\Anaconda3\lib\site-packages\requests\models.py in raise_for_status(self)
  926 
  927     if http_error_msg:
--> 928       raise HTTPError(http_error_msg, response=self)
  929 
  930   def close(self):


HTTPError: 404 Client Error: NOT FOUND for url: http://httpbin.org/status/404

三、响应头

获取响应头

r = requests.get('https://www.baidu.com')
r.headers

{'Cache-Control': 'private, no-cache, no-store, proxy-revalidate, no-transform', 'Connection': 'Keep-Alive', 'Content-Encoding': 'gzip', 'Content-Type': 'text/html', 'Date': 'Mon, 23 Jul 2018 09:04:12 GMT', 'Last-Modified': 'Mon, 23 Jan 2017 13:23:51 GMT', 'Pragma': 'no-cache', 'Server': 'bfe/1.0.8.18', 'Set-Cookie': 'BDORZ=27315; max-age=86400; domain=.baidu.com; path=/', 'Transfer-Encoding': 'chunked'}

获取响应头的具体字段

print(r.headers['Server'])
print(r.headers.get('Server'))

bfe/1.0.8.18
bfe/1.0.8.18

更多关于Python爬虫库requestsr的使用方法请查看下面的相关链接

推荐阅读

程序员
从列表中调用元素的析构函数

如何解决《从列表中调用元素的析构函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
GetWindowRect返回包含"不可见"边框的大小

如何解决《GetWindowRect返回包含"不可见"边框的大小》经验，为你挑选了1个好方法。 ... [详细]
程序员
给定一个数组,找到小于c的n个数字的组合

如何解决《给定一个数组,找到小于c的n个数字的组合》经验，为你挑选了0个好方法。 ... [详细]
程序员
我如何找到谷歌bigquery数据集大小,而不是表大小

如何解决《我如何找到谷歌bigquery数据集大小,而不是表大小》经验，为你挑选了1个好方法。 ... [详细]
程序员
基于Python中的键的多个词典中的平均值？

如何解决《基于Python中的键的多个词典中的平均值？》经验，为你挑选了1个好方法。 ... [详细]
程序员
ggplot和png的rmarkdown错误

如何解决《ggplot和png的rmarkdown错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
将远程转储还原到RDS

如何解决《将远程转储还原到RDS》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何限制nohup.out日志的大小

如何解决《如何限制nohup.out日志的大小》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何检查Eigen :: Matrix4f是否接近单位矩阵？

如何解决《如何检查Eigen::Matrix4f是否接近单位矩阵？》经验，为你挑选了1个好方法。 ... [详细]
程序员
React Native,TouchableOpacity包装浮动按钮什么都没得到

如何解决《ReactNative,TouchableOpacity包装浮动按钮什么都没得到》经验，为你挑选了1个好方法。 ... [详细]
程序员
C中头文件中的内联函数

如何解决《C中头文件中的内联函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
反序列化非标准字符串

如何解决《反序列化非标准字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
脚本返回"已杀"

如何解决《脚本返回"已杀"》经验，为你挑选了1个好方法。 ... [详细]
程序员
将非必需的字符串属性从null水合为空字符串

如何解决《将非必需的字符串属性从null水合为空字符串》经验，为你挑选了0个好方法。 ... [详细]
程序员
加载模板dom时,angular2模板/钩子中的脚本标记

如何解决《加载模板dom时,angular2模板/钩子中的脚本标记》经验，为你挑选了2个好方法。 ... [详细]
程序员
GIT推送错误 - 重复请求

如何解决《GIT推送错误-重复请求》经验，为你挑选了1个好方法。 ... [详细]
程序员
node.js可以排队多少个事件？

如何解决《node.js可以排队多少个事件？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何获得火花工作的指标？

如何解决《如何获得火花工作的指标？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在通过Openpyxl创建的图表中显示数据标签

如何解决《如何在通过Openpyxl创建的图表中显示数据标签》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Ruby 2.2.3和rest-client保存文件

如何解决《如何使用Ruby2.2.3和rest-client保存文件》经验，为你挑选了1个好方法。 ... [详细]

雨天是最美

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章