显然,您可以使用|
(管道?)来表示OR
,但有没有办法表示AND
?
具体来说,我想匹配包含某个短语的所有文本的段落,但没有特定的顺序.
使用非消费正则表达式.
典型的(即Perl/Java)表示法是:
(?=
EXPR)
这意味着"匹配expr但在此之后继续匹配原始匹配点".
您可以根据需要执行其中的许多操作,这将是"和".例:
(?=match this expression)(?=match this too)(?=oh, and this)
如果需要在其中保存一些数据,甚至可以在非消费表达式中添加捕获组.
你需要像其他一些响应者所说的那样使用前瞻,但是前瞻必须考虑其目标词和当前匹配位置之间的其他字符.例如:
(?=.*word1)(?=.*word2)(?=.*word3)
在.*
第一先行让它符合它需要它得到"字词1"之前,无论多少个字符.然后重置匹配位置,第二个前瞻搜索"word2".再次重置,最后一部分匹配"word3"; 因为这是你要检查的最后一个词,所以它没有必要在前瞻,但它并没有伤害.
为了匹配整个段落,您需要在两端锚定正则表达式并添加final .*
以消耗剩余的字符.使用Perl样式表示法,即:
/^(?=.*word1)(?=.*word2)(?=.*word3).*$/m
'm'修饰符用于多线模式; 它允许^
和$
匹配段落边界(正则表达式中的"行边界").在这种情况下,您必须不使用's'修饰符,它允许点元字符匹配换行符以及所有其他字符.
最后,您要确保匹配整个单词而不仅仅是较长单词的片段,因此您需要添加单词边界:
/^(?=.*\bword1\b)(?=.*\bword2\b)(?=.*\bword3\b).*$/m
看看这个例子:
我们有2个正则表达式A和B,我们想要匹配它们,所以在伪代码中它看起来像这样:
pattern = "/A AND B/"
它可以在不使用AND运算符的情况下编写,如下所示:
pattern = "/NOT (NOT A OR NOT B)/"
在PCRE中:
"/(^(^A|^B))/" regexp_match(pattern,data)
你可以用正则表达式做到这一点,但可能你会想要其他的.例如,使用几个正则表达式并将它们组合在一个if子句中.
您可以使用标准正则表达式枚举所有可能的排列,如下所示(按任意顺序匹配a,b和c):
(abc)|(bca)|(acb)|(bac)|(cab)|(cba)
但是,如果您有多个术语,这会产生一个非常长且可能效率低下的正则表达式.
如果你使用的是一些扩展的正则表达式版本,比如Perl或Java,他们有更好的方法来做到这一点.其他答案建议使用积极的先行操作.
AND运算符隐含在RegExp语法中.
相反,OR运算符用管道指定.
以下RegExp:
var re = /ab/;
是指字母a
和字母b
.
它也适用于群组:
var re = /(co)(de)/;
它意味着团体co
和团体de
.
用OR替换(隐式)AND将需要以下行:
var re = /a|b/; var re = /(co)|(de)/;
在您的情况下,在几个匹配结果上进行AND是不可能的吗?在伪代码中
regexp_match(pattern1, data) && regexp_match(pattern2, data) && ...
为什么不用awk?
与awk正则表达式和,或者事情是如此简单
awk '/WORD1/ && /WORD2/ && /WORD3/' myfile
如果使用Perl正则表达式,则可以使用正向前瞻:
例如
(?=[1-9][0-9]{2})[0-9]*[05]\b
将是大于100的数字并且可以被5整除
您可以将输出传输到另一个正则表达式.使用grep,你可以这样做:
grep A | grep B
除了接受的答案
我将为您提供一些实用的例子,让您的一些人更清楚.例如,假设我们有三行文字:
[12/Oct/2015:00:37:29 +0200] // only this + will get selected [12/Oct/2015:00:37:x9 +0200] [12/Oct/2015:00:37:29 +020x]
在这里看演示 DEMO
我们在这里要做的是选择+符号,但前提是它是在带有空格的两个数字之后,如果它在四个数字之前.这些是唯一的限制因素.我们将使用此正则表达式来实现它:
'~(?<=\d{2} )\+(?=\d{4})~g'
请注意,如果您将表达式分开,它将为您提供不同的结果.
或许你想在标签之间选择一些文字......但不是标签!然后你可以使用:
'~(?<=).*?(?=<\/p>)~g'
对于这个文字:
Hello !
I wont select tags! Only text with in
在这里看演示 DEMO
该顺序始终隐含在正则表达式的结构中。为了完成所需的操作,您必须针对不同的表达式多次匹配输入字符串。
单个正则表达式是不可能做到的。