1、通过urllib.requests模块实现发送请求并读取网页内容的简单示例如下:
#导入模块 import urllib.request #打开需要爬取的网页 response = urllib.request.urlopen('http://www.baidu.com') #读取网页代码 html = response.read() #打印读取的内容 print(html)
结果:
b'\n\n\n \n \n\xe7\x99\xbe\xe5\xba\xa6\xe4\xb8\x80\xe4\xb8\x8b\xef\xbc\x8c\xe4\xbd\xa0\xe5\xb0\xb1\xe7\x9f\xa5\xe9\x81\x93 \r\n\t\r\n\tTags | 热门标签RankList | 热门文章
- 1设置为生产模式时,Webpack Globalize失败构建:未提供格式化程序或解析器
- 2iOS蓝牙状态保存和恢复的DUPLICATE ISSUE -25299
- 3有没有办法优雅地更改rails secret_key_base?
- 4如何异步读取文件?
- 5invokestatic on interface中的静态方法
- 6使用Tampermonkey在AngularJS网站上自动提交表单?
- 7MVC5网站中的批处理
- 8如何在Laravel 5中使用缓存并保留代码DRY
- 9获取资源的大小
- 10将unicode打印到控制台
- 11重新排序R data.frame中的因子级别
- 12获得仅限测试以在SBT控制台之外工作
- 13在Swift中将数组从24小时转换为12小时
- 14在需要密码时检查是否可以进行SSH连接
- 15为什么struct/union兼容性需要标记和名称相等?
- 16TensorFlow从numpy数组创建数据集
- 17Python线程名称不会显示在ps或htop上
- 18以编程方式捕获WPF绑定错误
- 19整数溢出异常
- 20TypedFactory在组件将其用作依赖项之前进行处置