8赞

urllib2文件名

作者：拾味湖 | 2023-09-04 15:35

如何解决《urllib2文件名》经验，为你挑选了4个好方法。

如果我使用urllib2打开文件,如下所示:

remotefile = urllib2.urlopen('http://example.com/somefile.zip')

有没有一种简单的方法来获取文件名,然后解析原始URL？

编辑:将openfile更改为urlopen ...不确定是怎么回事.

编辑2:我最终使用:

filename = url.split('/')[-1].split('#')[0].split('?')[0]

除非我弄错了,否则这也应该删除所有潜在的查询.

1> Jonny Buchan..：

你的意思是urllib2.urlopen？

如果服务器通过检查发送Content-Disposition标头,您可能会提升预期的文件名,但因为我认为您只需要解析该URL.remotefile.info()['Content-Disposition']

您可以使用urlparse.urlsplit,但如果您有任何类似于第二个示例的URL,您最终还是必须自己提取文件名:

>>> urlparse.urlsplit('http://example.com/somefile.zip')
('http', 'example.com', '/somefile.zip', '', '')
>>> urlparse.urlsplit('http://example.com/somedir/somefile.zip')
('http', 'example.com', '/somedir/somefile.zip', '', '')

不妨这样做:

>>> 'http://example.com/somefile.zip'.split('/')[-1]
'somefile.zip'
>>> 'http://example.com/somedir/somefile.zip'.split('/')[-1]
'somefile.zip'

我会*总是*使用urlsplit()而不是直接字符串拆分.如果你有一个附加了片段或查询的URL,后者会阻塞,比如http://example.com/filename.html?cookie=55#Section_3.

使用posixpath.basename()而不是手动拆分'/'.

2> Jay..：

如果您只想要文件名本身,假设最后没有查询变量,如http://example.com/somedir/somefile.zip?foo=bar,那么您可以使用os.path.basename:

[user@host]$ python
Python 2.5.1 (r251:54869, Apr 18 2007, 22:08:04) 
Type "help", "copyright", "credits" or "license" for more information.
>>> import os
>>> os.path.basename("http://example.com/somefile.zip")
'somefile.zip'
>>> os.path.basename("http://example.com/somedir/somefile.zip")
'somefile.zip'
>>> os.path.basename("http://example.com/somedir/somefile.zip?foo=bar")
'somefile.zip?foo=bar'

其他一些海报提到使用urlparse,这将起作用,但你仍然需要从文件名中删除前导目录.如果使用os.path.basename(),那么您不必担心,因为它只返回URL或文件路径的最后部分.

使用`os.path`来解析URL似乎依赖于当前的操作系统拆分路径,就像拆分URL一样.我不认为每个操作系统都能保证.

3> Rafał Dowgir..：

我认为"文件名"在http传输方面并不是一个定义明确的概念.服务器可能(但不是必须)提供一个"content-disposition"标头,您可以尝试使用它remotefile.headers['Content-Disposition'].如果失败,您可能必须自己解析URI.

4> 小智..：

刚刚看到我通常做的..

filename = url.split("?")[0].split("/")[-1]

推荐阅读

程序员
从JavaFX Label中删除填充/边距

如何解决《从JavaFXLabel中删除填充/边距》经验，为你挑选了2个好方法。 ... [详细]
程序员
基于Gradle规则的模型嵌套bean语法

如何解决《基于Gradle规则的模型嵌套bean语法》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在使用Maven BOM文件时指定插件依赖项的版本

如何解决《如何在使用MavenBOM文件时指定插件依赖项的版本》经验，为你挑选了1个好方法。 ... [详细]
程序员
删除Python中列表中某些字符的元素

如何解决《删除Python中列表中某些字符的元素》经验，为你挑选了2个好方法。 ... [详细]
程序员
在静态类中使用随机数

如何解决《在静态类中使用随机数》经验，为你挑选了1个好方法。 ... [详细]
程序员
空openCL程序抛出弃用警告

如何解决《空openCL程序抛出弃用警告》经验，为你挑选了1个好方法。 ... [详细]
程序员
传递null时应用默认的groovy方法参数值

如何解决《传递null时应用默认的groovy方法参数值》经验，为你挑选了1个好方法。 ... [详细]
程序员
Laravel&Carbon - 循环数据范围

如何解决《Laravel&Carbon-循环数据范围》经验，为你挑选了1个好方法。 ... [详细]
程序员
iOS - 无法从其dataSource获取单元格

如何解决《iOS-无法从其dataSource获取单元格》经验，为你挑选了1个好方法。 ... [详细]
程序员
单元测试; 正确的做法？

如何解决《单元测试;正确的做法？》经验，为你挑选了1个好方法。 ... [详细]
程序员
手动触发Sensu事件

如何解决《手动触发Sensu事件》经验，为你挑选了1个好方法。 ... [详细]
程序员
Steam API登录无效 - 还有其他方法吗？

如何解决《SteamAPI登录无效-还有其他方法吗？》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么我们需要两个定义:整数常量表达式和转换常量表达式？

如何解决《为什么我们需要两个定义:整数常量表达式和转换常量表达式？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Git和IntelliJ IDEA保持两个不同更改列表中的一个文件的更改

如何解决《使用Git和IntelliJIDEA保持两个不同更改列表中的一个文件的更改》经验，为你挑选了1个好方法。 ... [详细]
程序员
结帐时git内存不足

如何解决《结帐时git内存不足》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何用python获取安装linux rpms的列表

如何解决《如何用python获取安装linuxrpms的列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用c#计算datagridview中的行数

如何解决《使用c#计算datagridview中的行数》经验，为你挑选了1个好方法。 ... [详细]
程序员
C#:为什么传递null会使用Object []进行重载(但仅在某些情况下)？

如何解决《C#:为什么传递null会使用Object[]进行重载(但仅在某些情况下)？》经验，为你挑选了0个好方法。 ... [详细]
程序员
是否在C中允许/安全地使用不同尺寸的结构？

如何解决《是否在C中允许/安全地使用不同尺寸的结构？》经验，为你挑选了1个好方法。 ... [详细]
程序员
何时使用Angular的$元素

如何解决《何时使用Angular的$元素》经验，为你挑选了1个好方法。 ... [详细]

拾味湖

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章