10赞

使用urllib库的urlretrieve()方法下载网络文件到本地的方法

作者：郑小蒜9299_941611_G | 2022-10-18 04:11

今天小编就为大家分享一篇使用urllib库的urlretrieve()方法下载网络文件到本地的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

概述

见源码

源码

# !/usr/bin/env python
# -*- coding:utf-8 -*-
 
 
"""
图片(文件)下载,核心方法是 urllib.urlrequest 模块的 urlretrieve()方法
 urlretrieve(url, filename=None, reporthook=None, data=None)
 url: 文件url
 filename: 保存到本地时,使用的文件(路径)名称
 reporthook: 文件传输时的回调函数
 data: post提交到服务器的数据
 该方法返回一个二元元组("本地文件路径",)
"""
 
import requests
import urllib.request
from lxml import etree
 
 
def crawl():
 url='http://www.ivsky.com/tupian/haiyangshijie/'
 headers={
 "User-Agent":"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36",
 }
 
 resp=requests.get(url,headers=headers)
 
 if resp.status_code==200:
 resp.encoding='UTF-8'
 html=etree.HTML(resp.text)
 
 img_titles=html.xpath('//ul[@class="ali"]//a/@title')
 img_urls=html.xpath('//ul[@class="ali"]//a/img/@src')
 
 data=zip(img_titles,img_urls)
 for img_title,img_url in data:
  print('开始下载{title}.jpg'.format(title=img_title))
  result=urllib.request.urlretrieve(img_url,
     filename='../../data/图片下载爬虫/{title}.jpg'.format(title=img_title),
     reporthook=loading,
     data=None)
  # print(result)
 
def loading(blocknum,blocksize,totalsize):
 """
 回调函数: 数据传输时自动调用
 blocknum:已经传输的数据块数目
 blocksize:每个数据块字节
 totalsize:总字节
 """
 percent=int(100*blocknum*blocksize/totalsize)
 if percent>100:
 percent=100
 print("正在下载>>>{}%".format(percent))
 import time
 time.sleep(0.5)
 
 
if __name__ == '__main__':
 crawl()

运行结果

开始下载海里的海龟图片.jpg
正在下载>>>0%
正在下载>>>100%
开始下载绮丽的海底世界图片.jpg
正在下载>>>0%
正在下载>>>43%
正在下载>>>87%
正在下载>>>100%
开始下载可爱的海豹图片.jpg
正在下载>>>0%
正在下载>>>50%
正在下载>>>100%
开始下载不同的海星图片.jpg
正在下载>>>0%
正在下载>>>63%
正在下载>>>100%
开始下载可爱的水母图片.jpg
正在下载>>>0%
正在下载>>>100%
开始下载活泼可爱的海豚图片.jpg
正在下载>>>0%
正在下载>>>47%
正在下载>>>95%
正在下载>>>100%
开始下载阳光下的海胆壳图片.jpg
正在下载>>>0%
正在下载>>>63%
正在下载>>>100%
开始下载海洋中的水母图片.jpg
正在下载>>>0%
正在下载>>>56%
正在下载>>>100%
开始下载千姿百态的海螺图片.jpg
正在下载>>>0%
正在下载>>>62%
正在下载>>>100%
开始下载水族馆里的水生动植物图片.jpg
正在下载>>>0%
正在下载>>>46%
正在下载>>>93%
正在下载>>>100%
开始下载水母图片.jpg
正在下载>>>0%
正在下载>>>100%
开始下载海星摄影图片.jpg
正在下载>>>0%
正在下载>>>79%
正在下载>>>100%
开始下载五彩斑斓的海洋鱼群图片.jpg
正在下载>>>0%
正在下载>>>29%
正在下载>>>59%
正在下载>>>89%
正在下载>>>100%
开始下载漂亮的贝壳图片.jpg
正在下载>>>0%
正在下载>>>39%
正在下载>>>79%
正在下载>>>100%
开始下载海底水母图片.jpg
正在下载>>>0%
正在下载>>>82%
正在下载>>>100%
开始下载海底的珊瑚图片.jpg
正在下载>>>0%
正在下载>>>48%
正在下载>>>97%
正在下载>>>100%
开始下载海星高清图片.jpg
正在下载>>>0%
正在下载>>>25%
正在下载>>>50%
正在下载>>>75%
正在下载>>>100%
开始下载色彩鲜艳的热带海洋鱼图片.jpg
正在下载>>>0%
正在下载>>>63%
正在下载>>>100%

urllib库的urlretrieve方法下载网络文件到本地

以上这篇使用urllib库的urlretrieve()方法下载网络文件到本地的方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

推荐阅读

程序员
错误CS0433 System.Threading和mscorlib中都存在"任务"类型

如何解决《错误CS0433System.Threading和mscorlib中都存在"任务"类型》经验，为你挑选了0个好方法。 ... [详细]
程序员
角度2一次装订

如何解决《角度2一次装订》经验，为你挑选了3个好方法。 ... [详细]
程序员
Youtube视频播放和暂停取决于jquery框架的可见性

如何解决《Youtube视频播放和暂停取决于jquery框架的可见性》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用纯jQuery即时替换contenteditable中的文本

如何解决《使用纯jQuery即时替换contenteditable中的文本》经验，为你挑选了0个好方法。 ... [详细]
程序员
并行执行任务

如何解决《并行执行任务》经验，为你挑选了3个好方法。 ... [详细]
程序员
XAMPP Apache将我的虚拟主机重定向到/ dashboard

如何解决《XAMPPApache将我的虚拟主机重定向到/dashboard》经验，为你挑选了1个好方法。 ... [详细]
程序员
从不兼容的void*中分配int*

如何解决《从不兼容的void*中分配int*》经验，为你挑选了1个好方法。 ... [详细]
程序员
测试libstdc ++的版本是否使用符合C++ 11的std :: string

如何解决《测试libstdc++的版本是否使用符合C++11的std::string》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何使用setTimeout调用带有参数的javascript函数

如何解决《如何使用setTimeout调用带有参数的javascript函数》经验，为你挑选了3个好方法。 ... [详细]
程序员
为什么Redux的状态函数称为reducers？

如何解决《为什么Redux的状态函数称为reducers？》经验，为你挑选了5个好方法。 ... [详细]
程序员
找不到与给定名称匹配的资源'@android:style/Theme.Material.Light.DialogWhenLarge.NoActionBar'

如何解决《找不到与给定名称匹配的资源'@android:style/Theme.Material.Light.DialogWhenLarge.NoActionBar'》经验，为你挑选了1个好方法。 ... [详细]
程序员
Pandas DataFrame将多个列值堆叠为单个列

如何解决《PandasDataFrame将多个列值堆叠为单个列》经验，为你挑选了1个好方法。 ... [详细]
程序员
Dagger和Kotlin.Dagger不生成组件类

如何解决《Dagger和Kotlin.Dagger不生成组件类》经验，为你挑选了3个好方法。 ... [详细]
程序员
Xcode只看到一些嵌套类的类似扩展,这些扩展是用不同的文件编写的

如何解决《Xcode只看到一些嵌套类的类似扩展,这些扩展是用不同的文件编写的》经验，为你挑选了0个好方法。 ... [详细]
程序员
带有requireJS的工具提示系绳

如何解决《带有requireJS的工具提示系绳》经验，为你挑选了1个好方法。 ... [详细]
程序员
我的程序跳过if语句

如何解决《我的程序跳过if语句》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java数组和ArrayList声明中的冗余措辞

如何解决《Java数组和ArrayList声明中的冗余措辞》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Ramda中避免双重连续

如何解决《在Ramda中避免双重连续》经验，为你挑选了1个好方法。 ... [详细]
程序员
Apache HTTP Client和Spring RestTemplate之间的区别

如何解决《ApacheHTTPClient和SpringRestTemplate之间的区别》经验，为你挑选了1个好方法。 ... [详细]
程序员
在python中批量/批量DNS查找？

如何解决《在python中批量/批量DNS查找？》经验，为你挑选了1个好方法。 ... [详细]

郑小蒜9299_941611_G

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章