20赞

如何在Python中将url字符串拆分为单独的部分？

作者：k78283381 | 2023-08-31 19:57

如何解决《如何在Python中将url字符串拆分为单独的部分？》经验，为你挑选了4个好方法。

我决定今晚学习python :)我非常了解C(在其中写了一个操作系统)所以我不是编程中的菜鸟所以python中的所有东西看起来都很简单,但我不知道如何解决这个问题问题:假设我有这个地址:

http://example.com/random/folder/path.html 现在我如何从中创建两个字符串,一个包含服务器的"基本"名称,因此在此示例中它将是 http://example.com / 和另一个包含没有最后文件名的东西,所以在这个例子中它将是 http://example.com/random/folder/ .另外我当然知道分别找到第3个和最后一个斜线的可能性,但也许你知道一个更好的方法:]在两种情况下都有尾随斜线也很酷但是我不在乎因为它可以很容易地添加.那么任何人都有一个好的,快速的,有效的解决方案吗？或者只有"我的"解决方案,找到斜线？

谢谢!

1> sykora..：

python 2.x中的urlparse模块(或python 3.x中的urllib.parse)将是这样做的方法.

>>> from urllib.parse import urlparse
>>> url = 'http://example.com/random/folder/path.html'
>>> parse_object = urlparse(url)
>>> parse_object.netloc
'example.com'
>>> parse_object.path
'/random/folder/path.html'
>>> parse_object.scheme
'http'
>>>

如果您想在url下的文件路径上做更多工作,可以使用posixpath模块:

>>> from posixpath import basename, dirname
>>> basename(parse_object.path)
'path.html'
>>> dirname(parse_object.path)
'/random/folder'

之后,您可以使用posixpath.join将部件粘合在一起.

编辑:我完全忘记了Windows用户会在os.path中的路径分隔符上窒息.我阅读了posixpath模块文档,它有一个特殊的URL操作参考,所以一切都很好.

在urlparse上+1，但是不要使用os.path来操纵.path部分。os.path的处理必然因操作系统而异，而URI始终使用'/'作为路径部分分隔符。

唉,完全错过了那一个.自从我使用windows以来已经很久了:|.固定.

2> Mike Hamer..：

如果这是你的URL解析的范围,Python的内置rpartition将完成这项工作:

>>> URL = "http://example.com/random/folder/path.html"
>>> Segments = URL.rpartition('/')
>>> Segments[0]
'http://example.com/random/folder'
>>> Segments[2]
'path.html'

来自Pydoc,str.rpartition:

Splits the string at the last occurrence of sep, and returns a 3-tuple containing the part before the separator, the separator itself, and the part after the separator. If the separator is not found, return a 3-tuple containing two empty strings, followed by the string itself

这意味着rpartition会搜索你,并在你指定的字符的最后(最右边)出现时拆分字符串(在本例中为/).它返回一个包含以下内容的元组:

(everything to the left of char , the character itself , everything to the right of char)

3> Sebastian Di..：

我没有使用Python的经验,但是我找到了urlparse模块,它应该可以完成这项工作.

4> Paul Stephen..：

在Python中,许多操作都是使用列表完成的.Sebasian Dietz提到的urlparse模块可能很好地解决了你的具体问题,但是如果你通常对Pythonic的方法感兴趣,比如在字符串中找到斜杠,请尝试这样的事情:

url = 'http://example.com/random/folder/path.html'
# Create a list of each bit between slashes
slashparts = url.split('/')
# Now join back the first three sections 'http:', '' and 'example.com'
basename = '/'.join(slashparts[:3]) + '/'
# All except the last one
dirname = '/'.join(slashparts[:-1]) + '/'
print 'slashparts = %s' % slashparts
print 'basename = %s' % basename
print 'dirname = %s' % dirname

这个程序的输出是这样的:

slashparts = ['http:', '', 'example.com', 'random', 'folder', 'path.html']
basename = http://example.com/
dirname = http://example.com/random/folder/

有趣的位是split,join切片表示法数组[A:B](包括从末尾开始的负数),作为奖励,%字符串上的运算符给出printf样式的格式.

推荐阅读

程序员
跨数据中心的单个Kubernetes/OpenShift集群/实例？

如何解决《跨数据中心的单个Kubernetes/OpenShift集群/实例？》经验，为你挑选了1个好方法。 ... [详细]
程序员
SQL JOIN WITH OR条件

如何解决《SQLJOINWITHOR条件》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python文档字符串（Sphinx）中的csv表格式-单个单元格中有多行

如何解决《Python文档字符串（Sphinx）中的csv表格式-单个单元格中有多行》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Go中递归一个闭包？

如何解决《如何在Go中递归一个闭包？》经验，为你挑选了1个好方法。 ... [详细]
程序员
MTOUCH:错误MT0024:找不到所需文件iPhoneSimulator9.0.sdk"/SDKSettings.plist

如何解决《MTOUCH:错误MT0024:找不到所需文件iPhoneSimulator9.0.sdk"/SDKSettings.plist》经验，为你挑选了1个好方法。 ... [详细]
程序员
Camel cxf:cxfEndpoint生产者错误:无法找到带有操作名称的BindingOperationInfo

如何解决《Camelcxf:cxfEndpoint生产者错误:无法找到带有操作名称的BindingOperationInfo》经验，为你挑选了1个好方法。 ... [详细]
程序员
Visual Studio 2013 - 干净地禁用VSTEST Discovery Engine？

如何解决《VisualStudio2013-干净地禁用VSTESTDiscoveryEngine？》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以使用#define更改#include文件名？

如何解决《是否可以使用#define更改#include文件名？》经验，为你挑选了1个好方法。 ... [详细]
程序员
运行exe作为系统帐户

如何解决《运行exe作为系统帐户》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何让Spring Cloud Config服务器检查特定分支的配置？

如何解决《如何让SpringCloudConfig服务器检查特定分支的配置？》经验，为你挑选了3个好方法。 ... [详细]
程序员
jQuery Lightbox2无法正常工作

如何解决《jQueryLightbox2无法正常工作》经验，为你挑选了1个好方法。 ... [详细]
程序员
AWS EC2中的窃取时间过长

如何解决《AWSEC2中的窃取时间过长》经验，为你挑选了1个好方法。 ... [详细]
程序员
AngularJS:仅在选中复选框时,将一个输入框的值复制到另一个输入框

如何解决《AngularJS:仅在选中复选框时,将一个输入框的值复制到另一个输入框》经验，为你挑选了2个好方法。 ... [详细]
程序员
我们能否确保`+(nonnull instancetype)sharedInstance的可空性;`？

如何解决《我们能否确保`+(nonnullinstancetype)sharedInstance的可空性;`？》经验，为你挑选了1个好方法。 ... [详细]
程序员
RxJava,只有在第一个为空时才执行observable

如何解决《RxJava,只有在第一个为空时才执行observable》经验，为你挑选了1个好方法。 ... [详细]
程序员
jPlayer在轨道中间停止并开始重复轨道的一部分

如何解决《jPlayer在轨道中间停止并开始重复轨道的一部分》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在包中的文件中使用全局var？

如何解决《如何在包中的文件中使用全局var？》经验，为你挑选了2个好方法。 ... [详细]
程序员
条形码128 - 3位字符串条形码宽度大于4位数字符串条形码

如何解决《条形码128-3位字符串条形码宽度大于4位数字符串条形码》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android switchcompat禁用文本单击

如何解决《Androidswitchcompat禁用文本单击》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在STS中使用Apache Tomcat 8(Spring Tool Suite最新版本)？

如何解决《如何在STS中使用ApacheTomcat8(SpringToolSuite最新版本)？》经验，为你挑选了2个好方法。 ... [详细]

k78283381

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章