7赞

正则表达式,用于删除XML标记及其内容

作者：pan2502851807 | 2023-09-05 08:39

如何解决《正则表达式,用于删除XML标记及其内容》经验，为你挑选了1个好方法。

我有以下字符串,我想删除*和*(注意其中需要删除的其他标记内容),而不使用XML解析器(对于小字符串来说开销太大).

The big black cat sleeps.

VB.NET或C#中的任何正则表达式都可以.

1> tyshock..：

如果您只想从字符串中删除所有标记,请使用此(C#):

try {
    yourstring = Regex.Replace(yourstring, "(<[be]pt[^>]+>.+?)", "");
} catch (ArgumentException ex) {
    // Syntax error in the regular expression
}

编辑:

我决定用更好的选择添加我的解决方案.如果有嵌入式标签,则前一个选项不起作用.这个新的解决方案应该删除嵌入或不嵌入的所有<**pt*>标记.此外,此解决方案使用对原始[be]匹配的反向引用,以便找到完全匹配的结束标记.此解决方案还创建了一个可重用的Regex对象,以提高性能,以便每次迭代都不必重新编译正则表达式:

bool FoundMatch = false;

try {
    Regex regex = new Regex(@"<([be])pt[^>]+>.+?");
    while(regex.IsMatch(yourstring) ) {
        yourstring = regex.Replace(yourstring, "");
    }
} catch (ArgumentException ex) {
    // Syntax error in the regular expression
}

补充说明:

在评论中,用户表示担心'.' 模式匹配器将是cpu密集型.虽然在独立贪婪的'.'的情况下也是如此,但是使用非贪婪的字符'？' 导致正则表达式引擎只向前看,直到它找到模式中下一个字符与贪婪''的第一个匹配.这要求引擎一直向前看到字符串的末尾.我使用RegexBuddy作为正则表达式开发工具,它包含一个调试器,可以让您看到不同正则表达式模式的相对性能.如果需要,它还会自动评论你的正则表达式,所以我决定在这里包含这些注释来解释上面使用的正则表达式:

    // <([be])pt[^>]+>.+?
// 
// Match the character "<" literally «<»
// Match the regular expression below and capture its match into backreference number 1 «([be])»
//    Match a single character present in the list "be" «[be]»
// Match the characters "pt" literally «pt»
// Match any character that is not a ">" «[^>]+»
//    Between one and unlimited times, as many times as possible, giving back as needed (greedy) «+»
// Match the character ">" literally «>»
// Match any single character that is not a line break character «.+?»
//    Between one and unlimited times, as few times as possible, expanding as needed (lazy) «+?»
// Match the characters "" literally «pt>»

推荐阅读

程序员
使用带扩展名的Python运行Selenium WebDriver(.crx文件)

如何解决《使用带扩展名的Python运行SeleniumWebDriver(.crx文件)》经验，为你挑选了1个好方法。 ... [详细]
程序员
找不到Symfony 404

如何解决《找不到Symfony404》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何通过命令行安装crx Chrome扩展？

如何解决《如何通过命令行安装crxChrome扩展？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何跳过读取和排序C#的第一行

如何解决《如何跳过读取和排序C#的第一行》经验，为你挑选了1个好方法。 ... [详细]
程序员
iOS6将阴影添加到具有角半径的容器UIView

如何解决《iOS6将阴影添加到具有角半径的容器UIView》经验，为你挑选了1个好方法。 ... [详细]
程序员
将函数作为参数传递给java

如何解决《将函数作为参数传递给java》经验，为你挑选了4个好方法。 ... [详细]
程序员
Android:淡入淡出视图

如何解决《Android:淡入淡出视图》经验，为你挑选了3个好方法。 ... [详细]
程序员
Qunit测试在页面刷新时在通过和失败之间交替

如何解决《Qunit测试在页面刷新时在通过和失败之间交替》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用PowerShell确定具有特定文件扩展名的文件是否不在文件夹中

如何解决《使用PowerShell确定具有特定文件扩展名的文件是否不在文件夹中》经验，为你挑选了1个好方法。 ... [详细]
程序员
在iOS应用和Web应用上链接Facebook Graph

如何解决《在iOS应用和Web应用上链接FacebookGraph》经验，为你挑选了1个好方法。 ... [详细]
程序员
c ++对象初始化和构造函数语义

如何解决《c++对象初始化和构造函数语义》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java - String.replace()的意外行为

如何解决《Java-String.replace()的意外行为》经验，为你挑选了1个好方法。 ... [详细]
程序员
SQL错误 - 关键字'IS'附近的语法错误 - SQL中的数据库名称问题？

如何解决《SQL错误-关键字'IS'附近的语法错误-SQL中的数据库名称问题？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将(1:n)[boolean]分割成连续的序列

如何解决《将(1:n)[boolean]分割成连续的序列》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用guid和文件扩展名上传ASP.NET WebApi文件

如何解决《使用guid和文件扩展名上传ASP.NETWebApi文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
用一个月而不是一年创建大熊猫时间序列

如何解决《用一个月而不是一年创建大熊猫时间序列》经验，为你挑选了0个好方法。 ... [详细]
程序员
优雅的方式来跳过迭代中的元素

如何解决《优雅的方式来跳过迭代中的元素》经验，为你挑选了1个好方法。 ... [详细]
程序员
是e =事件|| window.event; IE8兼容性可接受

如何解决《是e=事件||window.event;IE8兼容性可接受》经验，为你挑选了1个好方法。 ... [详细]
程序员
比较两个名单

如何解决《比较两个名单》经验，为你挑选了1个好方法。 ... [详细]
程序员
动画谷歌地图折线

如何解决《动画谷歌地图折线》经验，为你挑选了1个好方法。 ... [详细]

pan2502851807

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章