我从网页(http://www.opensolaris.org/os/community/on/flag-days/all/)中提取一些代码,如下所示,
Build 110 Feb-25 Flag Day and Heads Up: Power Aware Dispatcher and Deep C-States
cpupm keyword mode extensions - PSARC/2008/777
CPU Deep Idle Keyword - PSARC/2008/663
并且它中有一些相对的url路径,现在我想用正则表达式搜索它并用绝对url路径替换它们.因为我知道urljoin可以做那样的替换工作,
>>> urljoin("http://www.opensolaris.org/os/community/on/flag-days/all/", ... "/os/community/arc/caselog/2008/777/") 'http://www.opensolaris.org/os/community/arc/caselog/2008/777/'
现在我想知道如何使用正则表达式搜索它们,最后将代码转换为,
Build 110 Feb-25 Flag Day and Heads Up: Power Aware Dispatcher and Deep C-States
cpupm keyword mode extensions - PSARC/2008/777
CPU Deep Idle Keyword - PSARC/2008/663
我对正则表达式的了解非常少,我想知道如何做到这一点.谢谢
我已经完成了使用Beautiful Soup的工作,haha~Thx适合所有人!
我不确定你想要实现什么,但在HTML中使用BASE标签可以为你做这个技巧,而不必在进行处理时使用正则表达式.