我在和雅虎搞砸了!管道,我正在用一些正则表达式撞墙.现在我熟悉Perl的正则表达式,但雅虎的规则似乎有所不同!管道.
我正在做的是获取一个页面并尝试将其转换为一个feed,我从HTML中删除链接的正则表达式工作正常,但我希望成为标签中的标题只输出原始文本.
在Perl和此在线regexp测试器中匹配的示例文本:
"费用乐趣"(英文男士) i> (另请参阅此其他网站 Nada )此处的其他一些文字
Tomalak.. 6
RegEx的标题:
(?i).*?([^<]*).* [ ] g [x] s [ ] m [ ] i
RegEx的链接:
(?i).*?href="([^"]*).* [ ] g [x] s [ ] m [ ] i
不知何故,不区分大小写的复选框似乎被打破了.幸运的是,你可以替代(?i)
,这很好地工作.
这是一个很好的web2.0-ish工具,用于测试正则表达式:RegExr.但由于某种原因,它仍然是测试版.;-)
RegEx的标题:
(?i).*?([^<]*).* [ ] g [x] s [ ] m [ ] i
RegEx的链接:
(?i).*?href="([^"]*).* [ ] g [x] s [ ] m [ ] i
不知何故,不区分大小写的复选框似乎被打破了.幸运的是,你可以替代(?i)
,这很好地工作.
这是一个很好的web2.0-ish工具,用于测试正则表达式:RegExr.但由于某种原因,它仍然是测试版.;-)