5赞

如何使用正则表达式删除其类的整个HTML标记(及其内容)？

作者：爱唱歌的郭少文_ | 2023-09-03 17:49

如何解决《如何使用正则表达式删除其类的整个HTML标记(及其内容)？》经验，为你挑选了2个好方法。

我对Regex不是很好,但我正在学习.

我想通过类名删除一些html标记.这是我到目前为止:

(.*?)

首先 .*？是因为它可能包含其他属性,第二个可能包含其他html内容.

我究竟做错了什么？我试了很多但没有成功.

更新

在DIV内部,它可以包含多行,我正在玩Perl正则表达式.

1> 小智..：

正如其他人所说,HTML处理使用正则表达式是非常棘手的,而DOM方法可能会更好.例如:

use HTML::TreeBuilder::XPath;

my $tree = HTML::TreeBuilder::XPath->new;
$tree->parse_file( 'yourdocument.html' );

for my $node ( $tree->findnodes( '//*[@class="footer"]' ) ) {
    $node->replace_with_content;   # delete element, but not the children
}

print $tree->as_HTML;

2> Chris Marast..：

您还希望在div标记之前允许其他内容

]*class="footer"[^>]*>(.*?)

另外,不区分大小写.您可能需要转义引号之类的内容或结束标记中的斜杠.你在做什么背景？

另请注意,使用正则表达式进行HTML解析可能非常讨厌,具体取决于输入.在下面的答案中提出了一个很好的观点 - 假设你有一个类似的结构:

Hi!

试图为此构建一个正则表达式是灾难的一个方法.最好的办法是将文档加载到DOM中,然后对其进行操作.

应该紧密映射到XML :: DOM的伪代码:

document = //load document
divs = document.getElementsByTagName("div");
for(div in divs) {
    if(div.getAttributes["class"] == "footer") {
        parent = div.getParent();
        for(child in div.getChildren()) {
            // filter attribute types?
            parent.insertBefore(div, child);
        }
        parent.removeChild(div);
    }
}

这是一个perl库,HTML :: DOM,另一个,XML :: DOM
.NET有内置的库来处理dom解析.

推荐阅读

程序员
如何获得完全黑暗的kibana？

如何解决《如何获得完全黑暗的kibana？》经验，为你挑选了1个好方法。 ... [详细]
程序员
让我们在modulus.io上加密证书

如何解决《让我们在modulus.io上加密证书》经验，为你挑选了1个好方法。 ... [详细]
程序员
AVR-GCC:错误:行尾的垃圾

如何解决《AVR-GCC:错误:行尾的垃圾》经验，为你挑选了1个好方法。 ... [详细]
程序员
自定义Google登录按钮 - iOS

如何解决《自定义Google登录按钮-iOS》经验，为你挑选了3个好方法。 ... [详细]
程序员
使用noncopyable成员聚合类的初始化

如何解决《使用noncopyable成员聚合类的初始化》经验，为你挑选了1个好方法。 ... [详细]
程序员
Eclipse Mars Java Decompiler

如何解决《EclipseMarsJavaDecompiler》经验，为你挑选了1个好方法。 ... [详细]
程序员
pandas DataFrame.replace函数在datetime中被破坏

如何解决《pandasDataFrame.replace函数在datetime中被破坏》经验，为你挑选了0个好方法。 ... [详细]
程序员
Angular 2和MySQL概念

如何解决《Angular2和MySQL概念》经验，为你挑选了1个好方法。 ... [详细]
程序员
Jsoup unescapes特殊人物

如何解决《Jsoupunescapes特殊人物》经验，为你挑选了0个好方法。 ... [详细]
程序员
Spring Boot Web应用程序中的角度路由

如何解决《SpringBootWeb应用程序中的角度路由》经验，为你挑选了1个好方法。 ... [详细]
程序员
尝试追加/替换数组元素时"对成员映射的模糊引用"

如何解决《尝试追加/替换数组元素时"对成员映射的模糊引用"》经验，为你挑选了1个好方法。 ... [详细]
程序员
Docker:已安装卷的权限

如何解决《Docker:已安装卷的权限》经验，为你挑选了1个好方法。 ... [详细]
程序员
SFINAE:std :: enable_if作为函数参数

如何解决《SFINAE:std::enable_if作为函数参数》经验，为你挑选了1个好方法。 ... [详细]
程序员
原型与 Flyweight设计模式

如何解决《原型与Flyweight设计模式》经验，为你挑选了1个好方法。 ... [详细]
程序员
BufferedReader readLine()方法返回boolean？

如何解决《BufferedReaderreadLine()方法返回boolean？》经验，为你挑选了1个好方法。 ... [详细]
程序员
R：PLM个人和时间固定效应，但没有其他回归因子

如何解决《R：PLM个人和时间固定效应，但没有其他回归因子》经验，为你挑选了1个好方法。 ... [详细]
程序员
错误:任务执行失败:ransformException

如何解决《错误:任务执行失败:ransformException》经验，为你挑选了1个好方法。 ... [详细]
程序员
逗号之后我不想要空格宽度 - 最佳做法？

如何解决《逗号之后我不想要空格宽度-最佳做法？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java:字符串模式:如何为具有特殊字符的所有字符字符指定正则表达式

如何解决《Java:字符串模式:如何为具有特殊字符的所有字符字符指定正则表达式》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在UITextField中添加图像和文本作为swift中心的占位符

如何解决《如何在UITextField中添加图像和文本作为swift中心的占位符》经验，为你挑选了0个好方法。 ... [详细]