python爬虫获取百度首页内容教学

作者：低调pasta_730 | 2021-11-03 07:14

在本篇内容里小编给大家分享了关于python爬虫获取百度首页内容教学，需要的朋友们可以跟着学习下。

由传智播客教程整理，我们这里使用的是python2.7.x版本，就是2.7之后的版本，因为python3的改动略大，我们这里不用它。现在我们尝试一下url和网络爬虫配合的关系，爬浏览器首页信息。

1、首先我们创建一个urllib2_test01.py，然后输入以下代码：

2、最简单的获取一个url的信息代码居然只需要4行，执行写的python代码：

3、之后我们会看到一下的结果

4、

实际上，如果我们在浏览器上打开网页主页的话，右键选择“查看源代码”，你会发现，跟我们刚打印出来的是一模一样的。也就是说，上面的4行代码就已经帮我们把百度的首页和全部代码爬了下来了。

5、下面我们介绍一下这四行代码，第一行如下图，这个就是将urllib2组件进入进来，供给我们使用。

6、图片下面这步骤是调用urllib2库中的urlopen方法，该方法接受一个url地址，然后将请求后的得到的回应封装到一个叫respones对象当中。

7、最后这里，是调用response对象的read（）方法，将请求的回应内容以字符串的形式给html变量。最后的print html就是将字符串打出来，所以说一个基本的url请求是对应的python代码是很简单的。

总结：以上就是关于利用python爬虫获取百度信息的步骤内容，感谢大家的学习和对的支持。

推荐阅读

程序员
有没有一种程序化的方法来绕过MIUI手机上的内存清理器？

如何解决《有没有一种程序化的方法来绕过MIUI手机上的内存清理器？》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Windows 10 Universal App中从JavaScript调用C#组件

如何解决《在Windows10UniversalApp中从JavaScript调用C#组件》经验，为你挑选了0个好方法。 ... [详细]
程序员
应该通过提交调用完成此事务

如何解决《应该通过提交调用完成此事务》经验，为你挑选了1个好方法。 ... [详细]
程序员
任务执行失败':app:shrinkReleaseMultiDexComponents'

如何解决《任务执行失败':app:shrinkReleaseMultiDexComponents'》经验，为你挑选了0个好方法。 ... [详细]
程序员
Android - 自定义按钮,具有形状可绘制和渐变编程

如何解决《Android-自定义按钮,具有形状可绘制和渐变编程》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么heroku local:run想要使用全局python安装而不是当前激活的虚拟环境？

如何解决《为什么herokulocal:run想要使用全局python安装而不是当前激活的虚拟环境？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python类中的继承顺序

如何解决《Python类中的继承顺序》经验，为你挑选了1个好方法。 ... [详细]
程序员
Google语音识别API:每个字的时间戳？

如何解决《Google语音识别API:每个字的时间戳？》经验，为你挑选了2个好方法。 ... [详细]
程序员
为什么在变量中存储值会改变相等比较的结果？

如何解决《为什么在变量中存储值会改变相等比较的结果？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Symfony2的Docker容器中的权限问题

如何解决《Symfony2的Docker容器中的权限问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java Stream:有没有办法迭代一次取两个元素而不是一个？

如何解决《JavaStream:有没有办法迭代一次取两个元素而不是一个？》经验，为你挑选了3个好方法。 ... [详细]
程序员
如何在scrollView中显示相邻的卡？

如何解决《如何在scrollView中显示相邻的卡？》经验，为你挑选了1个好方法。 ... [详细]
程序员
C#ColorMatrix索引超出界限

如何解决《C#ColorMatrix索引超出界限》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在Java中读取相同的文件两次？

如何解决《如何在Java中读取相同的文件两次？》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用随机访问迭代器调用模板函数

如何解决《使用随机访问迭代器调用模板函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
检查值是否在一系列数字之间

如何解决《检查值是否在一系列数字之间》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用量角器验证文本的一部分

如何解决《使用量角器验证文本的一部分》经验，为你挑选了1个好方法。 ... [详细]
程序员
php5升级后安装php mongo驱动程序时出错

如何解决《php5升级后安装phpmongo驱动程序时出错》经验，为你挑选了2个好方法。 ... [详细]
程序员
在朱莉娅变量中的数组结束

如何解决《在朱莉娅变量中的数组结束》经验，为你挑选了1个好方法。 ... [详细]
程序员
反应路由器链接参数.意外的字符'''.在uglify和eslint中

如何解决《反应路由器链接参数.意外的字符'''.在uglify和eslint中》经验，为你挑选了1个好方法。 ... [详细]

低调pasta_730

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章