当前位置:  开发笔记 > 编程语言 > 正文

如何拆分网址

如何解决《如何拆分网址》经验,为你挑选了2个好方法。

所以我使用python来做一些网页解析,我想将完整的网址分成两部分.说我有地址http://www.stackoverflow.com/questions/ask.我需要协议和域(例如http://www.stackoverflow.com)和路径(例如/ questions/ask).我认为这可能是由一些正则表达式解决的,但是我不是那么方便.有什么建议?



1> Ned Batcheld..:

丹是对的:urlparse是你的朋友:

>>> from urlparse import urlparse
>>>
>>> parts = urlparse("http://www.stackoverflow.com/questions/ask")
>>> parts.scheme + "://" + parts.netloc
'http://www.stackoverflow.com'
>>> parts.path
'/questions/ask'

注意:在Python 3中它是from urllib.parse import urlparse



2> Dan Fego..:

使用Python urlparse模块:

https://docs.python.org/library/urlparse.html

对于像这样定义良好且行为良好的问题,不要费心编写自己的代码,更不用说自己的正则表达式了.他们造成太多麻烦;-).

推荐阅读
手机用户2502852037
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有