当前位置:  开发笔记 > 编程语言 > 正文

正则表达式从html标记中去除属性和值

如何解决《正则表达式从html标记中去除属性和值》经验,为你挑选了1个好方法。

嗨,大家好,我对正则表达式很新,你能帮助我吗?

我有一个像这样的字符串"",attribute='value'可以是任何东西,我想做一个preg_replace刚才

如何指定通配符来替换srting中任意数量的任何字符?

像这样? preg_replace("//",$replacement,$string);

非常感谢



1> Kent Fredric..:

你有什么:

.*

将匹配"任何角色,并尽可能多.

你的意思

[^>]+

这意味着"任何角色,那不是">",必须至少有一个

或者替代地,

.*?

这意味着"任何角色,但只足以使这条规则有效"

但是不要

使用regexp解析HTML是不好的

使用任何现有的html解析器,DOM库,任何东西,JustNOTNAïVEREGEX

例如:

  

将正则表达式错误地抓住

'' 

这会引导你到这个正则表达式:

 `<[a-zA-Z]+( [a-zA-Z]+=['"][^"']['"])*)>  etc etc 

在这一点上,你会发现这个可爱的宝石:

 

你的头会爆炸.

(语法高亮显示验证我的观点,错误地匹配思考我结束了标记.)

推荐阅读
Gbom2402851125
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有