9赞

一则python3的简单爬虫代码

作者：135369一生真爱_890 | 2021-11-03 13:45

最近一直在学习Python，还有网络爬虫，于是就想起来把2者结合一下，所以就有了本文。

不得不说python的上手非常简单。在网上找了一下，大都是python2的帖子，于是随手写了个python3的。代码非常简单就不解释了，直接贴代码。

复制代码代码如下:

#test rdp
import urllib.request
import re

#登录用的帐户信息
data={}
data['fromUrl']=''
data['fromUrlTemp']=''
data['loginId']='12345'
data['password']='12345'
user_agent='Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
#登录地址
#url='http://192.168.1.111:8080/loginCheck'
postdata = urllib.parse.urlencode(data)
postdata = postdata.encode('utf-8')
headers = { 'User-Agent' : user_agent }
#登录
res = urllib.request.urlopen(url,postdata)
#取得页面html
strResult=(res.read().decode('utf-8'))
#用正则表达式取出所有A标签
p = re.compile(r'(.*?)')
for m in p.finditer(strResult):
print (m.group(1))#group(1)是href里面的内容，group(2)是a标签里的文字

关于cookie、异常等处理看了一下，没有花时间去处理，毕竟只是想通过写爬虫来学习python。

推荐阅读

程序员
将非必需的字符串属性从null水合为空字符串

如何解决《将非必需的字符串属性从null水合为空字符串》经验，为你挑选了0个好方法。 ... [详细]
程序员
加载模板dom时,angular2模板/钩子中的脚本标记

如何解决《加载模板dom时,angular2模板/钩子中的脚本标记》经验，为你挑选了2个好方法。 ... [详细]
程序员
GIT推送错误 - 重复请求

如何解决《GIT推送错误-重复请求》经验，为你挑选了1个好方法。 ... [详细]
程序员
node.js可以排队多少个事件？

如何解决《node.js可以排队多少个事件？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何获得火花工作的指标？

如何解决《如何获得火花工作的指标？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在通过Openpyxl创建的图表中显示数据标签

如何解决《如何在通过Openpyxl创建的图表中显示数据标签》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Ruby 2.2.3和rest-client保存文件

如何解决《如何使用Ruby2.2.3和rest-client保存文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
流程中的集合执行策略

如何解决《流程中的集合执行策略》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从HDFS中删除文件？

如何解决《如何从HDFS中删除文件？》经验，为你挑选了2个好方法。 ... [详细]
程序员
Android TalkBack专注于透明层

如何解决《AndroidTalkBack专注于透明层》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将ComboBox的SelectedItem绑定到作为ItemsSource项目副本的对象？

如何解决《如何将ComboBox的SelectedItem绑定到作为ItemsSource项目副本的对象？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Conda安装MySQLdb？

如何解决《如何使用Conda安装MySQLdb？》经验，为你挑选了3个好方法。 ... [详细]
程序员
使用python joblib访问和更改全局数组

如何解决《使用pythonjoblib访问和更改全局数组》经验，为你挑选了0个好方法。 ... [详细]
程序员
上传到VPP商店灰色

如何解决《上传到VPP商店灰色》经验，为你挑选了1个好方法。 ... [详细]
程序员
页面加载时元素高度的差异

如何解决《页面加载时元素高度的差异》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在Sage中获得给定长度的素数？

如何解决《如何在Sage中获得给定长度的素数？》经验，为你挑选了1个好方法。 ... [详细]
程序员
HTTP/2和CNAME如何协同工作？

如何解决《HTTP/2和CNAME如何协同工作？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Google Cloud Dataproc配置问题

如何解决《GoogleCloudDataproc配置问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
短绒和验证器有什么区别？

如何解决《短绒和验证器有什么区别？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Bootstrap 4 - 卡列中的响应卡

如何解决《Bootstrap4-卡列中的响应卡》经验，为你挑选了2个好方法。 ... [详细]

135369一生真爱_890

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章