当前位置:  开发笔记 > 编程语言 > 正文

在Regex中重叠匹配

如何解决《在Regex中重叠匹配》经验,为你挑选了2个好方法。

我似乎无法找到这个问题的答案,我想知道是否存在.简化示例:

考虑一个字符串"nnnn",其中我想找到"nn"的所有匹配 - 但也是那些彼此重叠的匹配.因此正则表达式将提供以下3个匹配:

    nn nn

    ñ NN ñ

    nn nn

我意识到这并不是正则表达式的意思,但是对字符串进行操作并手动解析它似乎是一个非常多的代码,考虑到实际上匹配必须使用模式而不是文字字符串来完成.



1> Jan Goyvaert..:

使用具有捕获组的前瞻工作,代价是使正则表达式更慢,更复杂.另一种解决方案是告诉Regex.Match()方法,下一次匹配尝试应该从哪里开始.试试这个:

Regex regexObj = new Regex("nn");
Match matchObj = regexObj.Match(subjectString);
while (matchObj.Success) {
    matchObj = regexObj.Match(subjectString, matchObj.Index + 1); 
}



2> VonC..:

一个可能的解决方案可能是使用积极的外观:

(?<=n)n

它会给你最终的位置:

    *N***ñ**NN  

    N*N***ñ**N  

    NN*N***ñ**


正如Timothy Khouri所提到的 ,积极的前瞻更为直观

我更喜欢他的命题(?=nn)n更简单的形式:

(n)(?=(n))

这将引用您想要的字符串的第一个位置,并将捕获组(2)中的第二个n.

那是因为:

可以在前瞻中使用任何有效的正则表达式.

如果它包含捕获括号,则将保存反向引用.

因此,组(1)和组(2)将捕获'n'表示的任何内容(即使它是复杂的正则表达式).


此外,你可以以积极的前瞻方式完成它:(?= nn)n ...说"前面是两个N,匹配一个N".
推荐阅读
贾志军
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有