14赞

python抓取豆瓣图片并自动保存示例学习

作者：小妖694_807 | 2021-09-08 08:36

python抓取豆瓣图片并自动保存示例学习，示例使用了beautifulsoup库分析HTML代码，beautifulsoup是一个HTMLXML解析器，可以用来做网页爬虫

环境Python 2.7.6，BS4，在powershell或命令行均可运行。请确保安装了BS模块

代码如下:

# -*- coding:utf8 -*-
# 2013.12.36 19:41 wnlo-c209
# 抓取dbmei.com的图片。

from bs4 import BeautifulSoup
import os, sys, urllib2

# 创建文件夹，昨天刚学会
path = os.getcwd() # 获取此脚本所在目录
new_path = os.path.join(path,u'豆瓣妹子')
if not os.path.isdir(new_path):
os.mkdir(new_path)

def page_loop(page=0):
url = 'http://www.dbmeizi.com/?p=%s' % page
content = urllib2.urlopen(url)

soup = BeautifulSoup(content)

my_girl = soup.find_all('img')

# 加入结束检测，写的不好....
if my_girl ==[]:
print u'已经全部抓取完毕'
sys.exit(0)

print u'开始抓取'
for girl in my_girl:
link = girl.get('src')
flink = 'http://www.dbmeizi.com/' + link

print flink
content2 = urllib2.urlopen(flink).read()
with open(u'豆瓣妹子'+'/'+flink[-11:],'wb') as code: #在OSC上现学的
code.write(content2)
page = int(page) + 1
print u'开始抓取下一页'
print 'the %s page' % page
page_loop(page)

page_loop().

推荐阅读

程序员
带有指示器和下一个/上一个按钮的Onsen-UI Carousel

如何解决《带有指示器和下一个/上一个按钮的Onsen-UICarousel》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python:它不允许我使用Tkinter root = Tk()错误

如何解决《Python:它不允许我使用Tkinterroot=Tk()错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
对数组进行排序,以便第一个和最后一个元素形成"对"

如何解决《对数组进行排序,以便第一个和最后一个元素形成"对"》经验，为你挑选了1个好方法。 ... [详细]
程序员
jsfiddle中没有框架部分

如何解决《jsfiddle中没有框架部分》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Python 3中安装和运行模块（入门）

如何解决《在Python3中安装和运行模块（入门）》经验，为你挑选了1个好方法。 ... [详细]
程序员
多列表理解

如何解决《多列表理解》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何获取字符串中组的所有排列？

如何解决《如何获取字符串中组的所有排列？》经验，为你挑选了1个好方法。 ... [详细]
程序员
浏览器支持Angular材质

如何解决《浏览器支持Angular材质》经验，为你挑选了2个好方法。 ... [详细]
程序员
在C#中的接口实现中使用继承的接口

如何解决《在C#中的接口实现中使用继承的接口》经验，为你挑选了1个好方法。 ... [详细]
程序员
打印任何STL容器

如何解决《打印任何STL容器》经验，为你挑选了2个好方法。 ... [详细]
程序员
当我需要总数时生成NAN

如何解决《当我需要总数时生成NAN》经验，为你挑选了1个好方法。 ... [详细]
程序员
响应式图像拉伸 - 基于y轴的网格？

如何解决《响应式图像拉伸-基于y轴的网格？》经验，为你挑选了0个好方法。 ... [详细]
程序员
显示分配堆栈跟踪时防止程序崩溃

如何解决《显示分配堆栈跟踪时防止程序崩溃》经验，为你挑选了1个好方法。 ... [详细]
程序员
斯坦福依赖解析器设置和NLTK

如何解决《斯坦福依赖解析器设置和NLTK》经验，为你挑选了1个好方法。 ... [详细]
程序员
SecCopyErrorMessageString在swift中给出"使用未解析的标识符"

如何解决《SecCopyErrorMessageString在swift中给出"使用未解析的标识符"》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么我还需要打开Swift字典值呢？

如何解决《为什么我还需要打开Swift字典值呢？》经验，为你挑选了1个好方法。 ... [详细]
程序员
ClassCastException Double to Float,即使我没有使用Double

如何解决《ClassCastExceptionDoubletoFloat,即使我没有使用Double》经验，为你挑选了1个好方法。 ... [详细]
程序员
Spring 4.2.3.RELEASE和Hibernate 5.0.4.Final兼容性问题

如何解决《Spring4.2.3.RELEASE和Hibernate5.0.4.Final兼容性问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
表中是否始终需要主键自动增量？

如何解决《表中是否始终需要主键自动增量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
当我无法访问CLI工具时,如何关闭JBoss Wildfly？

如何解决《当我无法访问CLI工具时,如何关闭JBossWildfly？》经验，为你挑选了1个好方法。 ... [详细]

小妖694_807

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章