18赞

如何使用urllib从网上下载图像

作者：135369一生真爱_890 | 2023-06-16 04:15

如何解决《如何使用urllib从网上下载图像》经验，为你挑选了1个好方法。

我正在尝试使用以下代码下载图像:

from urllib import urlretrieve
urlretrieve('http://gdimitriou.eu/wp-content/uploads/2008/04/google-image-search.jpg', 
            'google-image-search.jpg')

有效.图像已下载,可由任何图像查看器软件打开.

但是,下面的代码不起作用.下载的图像只有2KB,任何图像查看器都无法打开.

from urllib import urlretrieve
urlretrieve('http://upload.wikimedia.org/wikipedia/en/4/44/Zindagi1976.jpg', 
            'Zindagi1976.jpg')

这是HTML格式的结果.

    ERROR

The requested URL could not be retrieved

While trying to retrieve the URL: http://upload.wikimedia.org/wikipedia/en/4/44/Zindagi1976.jpg

The following error was encountered:

Access Denied.
Access control configuration prevents your request from being allowed at this time. Please contact your service provider if you feel this is incorrect.

Your cache administrator is nobody. 
Generated Mon, 05 Dec 2011 17:19:53 GMT by sq56.wikimedia.org (squid/2.7.STABLE9)

pyfunc.. 12

如果您使用以下内容,则可以下载图像:

wget http://upload.wikimedia.org/wikipedia/en/4/44/Zindagi1976.jpg

但是如果你做了以下事情:

from urllib import urlretrieve
urlretrieve('http://upload.wikimedia.org/wikipedia/en/4/44/Zindagi1976.jpg', 
            'Zindagi1976.jpg')

您可能无法下载图像.这可能是这种情况,因为维基百科可能有规则(robot.txt)来拒绝机器人或机器人(未知客户端).尝试模拟浏览器.

要做到这一点,你必须添加以下作为标题的一部分:

('User-agent', 
 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) 
 Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1')

你可以这样做:

>>> from urllib import FancyURLopener
>>> class MyOpener(FancyURLopener):
...     version = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; it; rv:1.8.1.11) Gecko/20071127 Firefox/2.0.0.11'
... 
>>> myopener = MyOpener()
>>> myopener.retrieve('http://upload.wikimedia.org/wikipedia/en/4/44/Zindagi1976.jpg', 'Zindagi1976.jpg')
('Zindagi1976.jpg', )

这将检索文件

1> pyfunc..：

如果您使用以下内容,则可以下载图像:

wget http://upload.wikimedia.org/wikipedia/en/4/44/Zindagi1976.jpg

但是如果你做了以下事情:

from urllib import urlretrieve
urlretrieve('http://upload.wikimedia.org/wikipedia/en/4/44/Zindagi1976.jpg', 
            'Zindagi1976.jpg')

您可能无法下载图像.这可能是这种情况,因为维基百科可能有规则(robot.txt)来拒绝机器人或机器人(未知客户端).尝试模拟浏览器.

要做到这一点,你必须添加以下作为标题的一部分:

('User-agent', 
 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) 
 Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1')

你可以这样做:

>>> from urllib import FancyURLopener
>>> class MyOpener(FancyURLopener):
...     version = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; it; rv:1.8.1.11) Gecko/20071127 Firefox/2.0.0.11'
... 
>>> myopener = MyOpener()
>>> myopener.retrieve('http://upload.wikimedia.org/wikipedia/en/4/44/Zindagi1976.jpg', 'Zindagi1976.jpg')
('Zindagi1976.jpg', )

这将检索文件

推荐阅读

程序员
Prototype构造函数上下文中的JavaScript类型检查和异常？

如何解决《Prototype构造函数上下文中的JavaScript类型检查和异常？》经验，为你挑选了1个好方法。 ... [详细]
程序员
来自splm的乳胶回归表

如何解决《来自splm的乳胶回归表》经验，为你挑选了0个好方法。 ... [详细]
程序员
在OS X上将项目迁移到Xcode 7.2 El Capitan打破了构建

如何解决《在OSX上将项目迁移到Xcode7.2ElCapitan打破了构建》经验，为你挑选了0个好方法。 ... [详细]
程序员
iOS 9.2缺少常规设置中的配置文件部分

如何解决《iOS9.2缺少常规设置中的配置文件部分》经验，为你挑选了1个好方法。 ... [详细]
程序员
docker:致命错误无法创建锁定文件:错误的文件描述符(9)

如何解决《docker:致命错误无法创建锁定文件:错误的文件描述符(9)》经验，为你挑选了2个好方法。 ... [详细]
程序员
ES6循环依赖

如何解决《ES6循环依赖》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何创建在线SignalR服务器

如何解决《如何创建在线SignalR服务器》经验，为你挑选了0个好方法。 ... [详细]
程序员
当你有一个额外的变量时,在R中循环以创建许多图

如何解决《当你有一个额外的变量时,在R中循环以创建许多图》经验，为你挑选了0个好方法。 ... [详细]
程序员
xquery从外部xs：string变量（basex）插入节点

如何解决《xquery从外部xs：string变量（basex）插入节点》经验，为你挑选了0个好方法。 ... [详细]
程序员
Django 1.9:我应该避免在`django.setup()`中导入模型吗？

如何解决《Django1.9:我应该避免在`django.setup()`中导入模型吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何遍历循环内的列表

如何解决《如何遍历循环内的列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何正确合并集合中模型的输出？

如何解决《如何正确合并集合中模型的输出？》经验，为你挑选了0个好方法。 ... [详细]
程序员
将工作日志发布到JIRA时需要哪些字段？

如何解决《将工作日志发布到JIRA时需要哪些字段？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在服务Web和API的Rails应用程序中正确使用protect_from_forgery

如何解决《在服务Web和API的Rails应用程序中正确使用protect_from_forgery》经验，为你挑选了0个好方法。 ... [详细]
程序员
当项目有复选框时,RecyclerView项目不显示涟漪/触摸反馈

如何解决《当项目有复选框时,RecyclerView项目不显示涟漪/触摸反馈》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何避免使用太多容器破坏Docker？

如何解决《如何避免使用太多容器破坏Docker？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Haskell将(0/0)设置为qnan

如何解决《Haskell将(0/0)设置为qnan》经验，为你挑选了1个好方法。 ... [详细]
程序员
Webpack Sass导入URL解析

如何解决《WebpackSass导入URL解析》经验，为你挑选了1个好方法。 ... [详细]
程序员
Matlab:什么更快？是否预先定义了有用的对象？

如何解决《Matlab:什么更快？是否预先定义了有用的对象？》经验，为你挑选了1个好方法。 ... [详细]
程序员
浮动和块级元素

如何解决《浮动和块级元素》经验，为你挑选了1个好方法。 ... [详细]

135369一生真爱_890

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章