当前位置:  开发笔记 > 编程语言 > 正文

正则表达式:是否有AND运算符?

如何解决《正则表达式:是否有AND运算符?》经验,为你挑选了11个好方法。

显然,您可以使用|(管道?)来表示OR,但有没有办法表示AND

具体来说,我想匹配包含某个短语的所有文本的段落,但没有特定的顺序.



1> Jason Cohen..:

使用非消费正则表达式.

典型的(即Perl/Java)表示法是:

(?=EXPR)

这意味着"匹配expr但在此之后继续匹配原始匹配点".

您可以根据需要执行其中的许多操作,这将是"和".例:

(?=match this expression)(?=match this too)(?=oh, and this)

如果需要在其中保存一些数据,甚至可以在非消费表达式中添加捕获组.


应该提到的是,这个特定的例子被称为正向前瞻性断言.它还有"和"之外的其他用途.请注意,文本未被使用.
perl -e"q {some stuff and things} =〜/(?=.*some)(?=.*stuff)(?=.*things)/?print'yes':print'no'"
像这样使用(?=)会产生一个永远不会成功的正则表达式.但它*是*的结合模拟.OP认为解决他的问题是错误的.
perl -e"q {some stuff and things} =〜/(?= some)(?= stuff)(?= things)/?print'yes':print'no'"prints'no'.
你可以在你的答案中添加一些简单的Perl代码示例吗?
值得一提的是,japavascript不支持预测.

2> Alan Moore..:

你需要像其他一些响应者所说的那样使用前瞻,但是前瞻必须考虑其目标词和当前匹配位置之间的其他字符.例如:

(?=.*word1)(?=.*word2)(?=.*word3)

.*第一先行让它符合它需要它得到"字词1"之前,无论多少个字符.然后重置匹配位置,第二个前瞻搜索"word2".再次重置,最后一部分匹配"word3"; 因为这是你要检查的最后一个词,所以它没有必要在前瞻,但它并没有伤害.

为了匹配整个段落,您需要在两端锚定正则表达式并添加final .*以消耗剩余的字符.使用Perl样式表示法,即:

/^(?=.*word1)(?=.*word2)(?=.*word3).*$/m

'm'修饰符用于多线模式; 它允许^$匹配段落边界(正则表达式中的"行边界").在这种情况下,您必须使用's'修饰符,它允许点元字符匹配换行符以及所有其他字符.

最后,您要确保匹配整个单词而不仅仅是较长单词的片段,因此您需要添加单词边界:

/^(?=.*\bword1\b)(?=.*\bword2\b)(?=.*\bword3\b).*$/m


非常感谢.*这有所不同
完全正确 - 还有一个关于此的教程!http://ocpsoft.org/tutorials/regular-expressions/and-in-regex/
如果在javascript中使用新的行作为`.`在javascript的正则表达式引擎中使用`.`替换`.``,则将`.*`替换为新的行,并且无法使用修饰符

3> fanjabi..:

看看这个例子:

我们有2个正则表达式A和B,我们想要匹配它们,所以在伪代码中它看起来像这样:

pattern = "/A AND B/"

它可以在不使用AND运算符的情况下编写,如下所示:

pattern = "/NOT (NOT A OR NOT B)/"

在PCRE中:

"/(^(^A|^B))/"

regexp_match(pattern,data)


在正则表达式语法中,"^"是指"字符串的开头"吗?
这在形式逻辑方面是正确的,但在这里绝对没有帮助.在正则表达式中,NOT比AND更难表达.

4> Juha Syrjälä..:

你可以用正则表达式做到这一点,但可能你会想要其他的.例如,使用几个正则表达式并将它们组合在一个if子句中.

您可以使用标准正则表达式枚举所有可能的排列,如下所示(按任意顺序匹配a,b和c):

(abc)|(bca)|(acb)|(bac)|(cab)|(cba)

但是,如果您有多个术语,这会产生一个非常长且可能效率低下的正则表达式.

如果你使用的是一些扩展的正则表达式版本,比如Perl或Java,他们有更好的方法来做到这一点.其他答案建议使用积极的先行操作.


我不认为你的方法比他们的灾难性回溯的3个前瞻更低效.当然,写入时间较长,但请注意,您可以轻松自动生成模式.请注意,使用`a(bc | cb)| b(ac | ca)| c(ab | ba)`可以提高它的速度.最重要的是,你可以使用它与所有正则表达的味道.

5> Emanuele Del..:

AND运算符隐含在RegExp语法中.
相反,OR运算符用管道指定.
以下RegExp:

var re = /ab/;

是指字母a 字母b.
它也适用于群组:

var re = /(co)(de)/;

它意味着团体co 团体de.
用OR替换(隐式)AND将需要以下行:

var re = /a|b/;
var re = /(co)|(de)/;


不幸的是,这不是OP所要求的.这可以按顺序查找任何内容,而他们可以按任何顺序查找它们.请查看http://stackoverflow.com/users/20938/alan-moore下面的答案,这是正确的答案.

6> user54579..:

在您的情况下,在几个匹配结果上进行AND是不可能的吗?在伪代码中

regexp_match(pattern1, data) && regexp_match(pattern2, data) && ...


我遇到的情况是,我有一些代码是规则的数据表,并且带有一个正则表达式模式匹配字符串来测试规则的有效性。在我的情况下,我无法进行多项测试,在其他人的情况下,也是如此!

7> mug896..:

为什么不用awk?
与awk正则表达式和,或者事情是如此简单

awk '/WORD1/ && /WORD2/ && /WORD3/' myfile



8> jpalecek..:

如果使用Perl正则表达式,则可以使用正向前瞻:

例如

(?=[1-9][0-9]{2})[0-9]*[05]\b

将是大于100的数字并且可以被5整除



9> garbagecolle..:

您可以将输出传输到另一个正则表达式.使用grep,你可以这样做:

grep A | grep B



10> DevWL..:

除了接受的答案

我将为您提供一些实用的例子,让您的一些人更清楚.例如,假设我们有三行文字:

[12/Oct/2015:00:37:29 +0200] // only this + will get selected
[12/Oct/2015:00:37:x9 +0200]
[12/Oct/2015:00:37:29 +020x]

在这里看演示 DEMO

我们在这里要做的是选择+符号,但前提是它是在带有空格的两个数字之后,如果它在四个数字之前.这些是唯一的限制因素.我们将使用此正则表达式来实现它:

'~(?<=\d{2} )\+(?=\d{4})~g'

请注意,如果您将表达式分开,它将为您提供不同的结果.

或许你想在标签之间选择一些文字......但不是标签!然后你可以使用:

'~(?<=

).*?(?=<\/p>)~g'

对于这个文字:

Hello !

I wont select tags! Only text with in

在这里看演示 DEMO



11> pilif..:

该顺序始终隐含在正则表达式的结构中。为了完成所需的操作,您必须针对不同的表达式多次匹配输入字符串。

单个正则表达式是不可能做到的。


可能是因为这不仅可能,而且很简单,假设您的regex风格支持先行。那是一个很好的选择;当今大多数主要的编程语言都支持它们。
推荐阅读
php
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有