Python基于BeautifulSoup和requests实现的爬虫功能示例

作者：mobiledu2402852413 | 2022-01-05 21:57

这篇文章主要介绍了Python基于BeautifulSoup和requests实现的爬虫功能,结合实例形式分析了Python使用BeautifulSoup和requests库爬取网站指定信息的相关操作技巧,需要的朋友可以参考下

本文实例讲述了Python基于BeautifulSoup和requests实现的爬虫功能。分享给大家供大家参考，具体如下：

爬取的目标网页：http://www.qianlima.com/zb/area_305/

这是一个招投标网站，我们使用python脚本爬取红框中的信息，包括链接网址、链接名称、时间等三项内容。

使用到的Python库：BeautifulSoup、requests

代码如下：

# -*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
url = 'http://www.qianlima.com/zb/area_305/'
user_agent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36'
headers = { 'User-Agent' : user_agent}
r = requests.get(url,headers=headers)#连接
content = r.text#获取内容，自动转码unicode
soup = BeautifulSoup(content,"lxml")
tags1 = soup.select('div .shixian_zhaobiao')
tag1 = tags1[0]
tag2 = tag1.find(name = 'dl')
tags2 = tag2.find_all(name = 'a')
tags3 = tag2.find_all(name = 'dd')
for tag in tags2:
 print tag.get('href')
 print tag.string
 print tag.next_element.next_element.string

运行结果如下

更多关于Python相关内容可查看本站专题：《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

推荐阅读

程序员
脚本返回"已杀"

如何解决《脚本返回"已杀"》经验，为你挑选了1个好方法。 ... [详细]
程序员
将非必需的字符串属性从null水合为空字符串

如何解决《将非必需的字符串属性从null水合为空字符串》经验，为你挑选了0个好方法。 ... [详细]
程序员
加载模板dom时,angular2模板/钩子中的脚本标记

如何解决《加载模板dom时,angular2模板/钩子中的脚本标记》经验，为你挑选了2个好方法。 ... [详细]
程序员
GIT推送错误 - 重复请求

如何解决《GIT推送错误-重复请求》经验，为你挑选了1个好方法。 ... [详细]
程序员
node.js可以排队多少个事件？

如何解决《node.js可以排队多少个事件？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何获得火花工作的指标？

如何解决《如何获得火花工作的指标？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在通过Openpyxl创建的图表中显示数据标签

如何解决《如何在通过Openpyxl创建的图表中显示数据标签》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Ruby 2.2.3和rest-client保存文件

如何解决《如何使用Ruby2.2.3和rest-client保存文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
流程中的集合执行策略

如何解决《流程中的集合执行策略》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从HDFS中删除文件？

如何解决《如何从HDFS中删除文件？》经验，为你挑选了2个好方法。 ... [详细]
程序员
Android TalkBack专注于透明层

如何解决《AndroidTalkBack专注于透明层》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将ComboBox的SelectedItem绑定到作为ItemsSource项目副本的对象？

如何解决《如何将ComboBox的SelectedItem绑定到作为ItemsSource项目副本的对象？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Conda安装MySQLdb？

如何解决《如何使用Conda安装MySQLdb？》经验，为你挑选了3个好方法。 ... [详细]
程序员
使用python joblib访问和更改全局数组

如何解决《使用pythonjoblib访问和更改全局数组》经验，为你挑选了0个好方法。 ... [详细]
程序员
上传到VPP商店灰色

如何解决《上传到VPP商店灰色》经验，为你挑选了1个好方法。 ... [详细]
程序员
页面加载时元素高度的差异

如何解决《页面加载时元素高度的差异》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在Sage中获得给定长度的素数？

如何解决《如何在Sage中获得给定长度的素数？》经验，为你挑选了1个好方法。 ... [详细]
程序员
HTTP/2和CNAME如何协同工作？

如何解决《HTTP/2和CNAME如何协同工作？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Google Cloud Dataproc配置问题

如何解决《GoogleCloudDataproc配置问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
短绒和验证器有什么区别？

如何解决《短绒和验证器有什么区别？》经验，为你挑选了1个好方法。 ... [详细]

mobiledu2402852413

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章