我正在使用Python从链接中使用rfind提取文件名,如下所示:
url = "http://www.google.com/test.php" print url[url.rfind("/") +1 : ]
这适用于没有/在它们末尾的链接并返回"test.php".我遇到了/在最后的链接,如" http://www.google.com/test.php/ ".当最后有"/"时,我无法获取页面名称,任何人都可以帮忙吗?
干杯
只删除末尾的斜杠是行不通的,因为你可能有一个如下所示的URL:
http://www.google.com/test.php?filepath=tests/hey.xml
...在这种情况下你会得到"hey.xml".您可以使用urlparse去除参数,而不是手动检查这些参数,然后检查其他人的建议:
from urlparse import urlparse url = "http://www.google.com/test.php?something=heyharr/sir/a.txt" f = urlparse(url)[2].rstrip("/") print f[f.rfind("/")+1:]