我需要搜索那些违反我们"不使用您的数据中的社会安全号码"规则的人,并且需要知道下面两行之间是否存在性能差异(以及原因).
谢谢.
[0-9]{3}-[0-9]{2}-[0-9]{4}
VS
\d\d\d-\d\d-\d\d\d\d
请求的详细信息:
引擎:删除以阻止标记混淆
我认为你会发现性能差异微不足道.使用第一个,因为它一目了然更容易阅读.编译正则表达式后(如果您在将其用于重用之前进行编译),无论如何都无关紧要.
在需要优化之前不要进行优化.
除了性能之外,我最近发现\ d和[0-9]不相同,因为它们不仅仅是10位数.因此,第二个版本可能会产生更多的误报.