19赞

改进/修复C样式块注释的正则表达式

作者：臭小子 | 2023-08-31 17:48

如何解决《改进/修复C样式块注释的正则表达式》经验，为你挑选了2个好方法。

我正在编写(在C#中)一个简单的解析器来处理一个看起来很像经典C的脚本语言.

在我拥有的一个脚本文件中,我用来识别/*阻止注释*/的正则表达式将进入某种无限循环,占用100%的CPU.

我正在使用的正则表达式是这样的:

/\*([^*]|[\r\n]|(\*+([^*/]|[\r\n])))*\*+/

有关为什么会被锁定的任何建议？

或者,我可以使用的另一个正则表达式是什么？

更多信息:

使用面向.NET 3.5的C#3.0;

我正在使用Regex.Match(string,int)方法在字符串的特定索引处开始匹配;

我让程序运行了一个多小时,但比赛没有完成;

传递给Regex构造函数的选项是RegexOptions.Multiline和 RegexOptions.IgnorePatternWhitespace;

正则表达式适用于我的453个测试文件中的452个.

Alan Moore.. 16

我在你的正则表达式中遇到的一些问题:

|[\r\n]你的正则表达式中不需要序列; 否定的字符类[^*]匹配除了*包括行分隔符在内的所有内容.它只是.(点)元字符与那些不匹配.

一旦你进入评论,你必须寻找的唯一一个字符是星号; 只要你没有看到其中一个,你就可以吞噬你想要的任意数量的角色.这意味着[^*]当你可以使用它时使用是没有意义的[^*]+.事实上,你可以把它放在一个原子组中 - (?>[^*]+)因为一旦你匹配它们,你就没有任何理由放弃任何那些非星号.

过滤掉无关的垃圾,你最外面的parens里面的最后一个选择是\*+[^*/],这意味着"一个或多个星号,后跟一个不是星号或斜线的字符".这将始终与注释末尾的星号相匹配,并且它将始终必须再次放弃,因为下一个字符是斜杠.事实上,如果有20个星号导致最后的斜线,那么正则表达式的那部分将与它们全部匹配,那么它将一个接一个地给它们全部.然后最后的部分 - \*+/将匹配它们保持.

为了获得最佳性能,我会使用这个正则表达式:

/\*(?>(?:(?>[^*]+)|\*(?!/))*)\*/



这将非常快速地匹配格式良好的注释,但更重要的是,如果它开始匹配不是有效注释的内容,它将尽快失败.



由David提供,这是一个匹配任何嵌套级别的嵌套注释的版本:

(?s)/\*(?>/\*(?)|\*/(?<-LEVEL>)|(?!/\*|\*/).)+(?(LEVEL)(?!))\*/


它使用.NET的平衡组,因此它不适用于任何其他风格.为了完整起见,这是另一个版本(来自RegexBuddy的库),它使用Perl,PCRE和Oniguruma/Onigmo支持的递归组语法:

/\*(?>[^*/]+|\*[^/]|/[^*])*(?>(?R)(?>[^*/]+|\*[^/]|/[^*])*)*\*/

        
          
        

      

    
  

  
  

    

      

        ridgerunner..
         14
      
      
不不不!没有其他人阅读掌握正则表达式(第3版)!？在此,Jeffrey Friedl检查了这个确切的问题,并以此为例(第272-276页)来说明他的"展开循环"技术.他对大多数正则表达式引擎的解决方案是这样的:

/\*[^*]*\*+(?:[^*/][^*]*\*+)*/

但是,如果正则表达式引擎被优化以处理惰性量词(如Perl的那样),则最有效的表达式更简单(如上所述):

/\*.*?\*/

(当然应用等效的's'"点匹配所有"修饰符.)请注意,我不使用.NET,所以我不能说哪个版本对于该引擎更快.


1> Alan Moore..：
我在你的正则表达式中遇到的一些问题:

|[\r\n]你的正则表达式中不需要序列; 否定的字符类[^*]匹配除了*包括行分隔符在内的所有内容.它只是.(点)元字符与那些不匹配.

一旦你进入评论,你必须寻找的唯一一个字符是星号; 只要你没有看到其中一个,你就可以吞噬你想要的任意数量的角色.这意味着[^*]当你可以使用它时使用是没有意义的[^*]+.事实上,你可以把它放在一个原子组中 - (?>[^*]+)因为一旦你匹配它们,你就没有任何理由放弃任何那些非星号.

过滤掉无关的垃圾,你最外面的parens里面的最后一个选择是\*+[^*/],这意味着"一个或多个星号,后跟一个不是星号或斜线的字符".这将始终与注释末尾的星号相匹配,并且它将始终必须再次放弃,因为下一个字符是斜杠.事实上,如果有20个星号导致最后的斜线,那么正则表达式的那部分将与它们全部匹配,那么它将一个接一个地给它们全部.然后最后的部分 - \*+/将匹配它们保持.

为了获得最佳性能,我会使用这个正则表达式:



/\*(?>(?:(?>[^*]+)|\*(?!/))*)\*/


这将非常快速地匹配格式良好的注释,但更重要的是,如果它开始匹配不是有效注释的内容,它将尽快失败.



由David提供,这是一个匹配任何嵌套级别的嵌套注释的版本:

(?s)/\*(?>/\*(?)|\*/(?<-LEVEL>)|(?!/\*|\*/).)+(?(LEVEL)(?!))\*/


它使用.NET的平衡组,因此它不适用于任何其他风格.为了完整起见,这是另一个版本(来自RegexBuddy的库),它使用Perl,PCRE和Oniguruma/Onigmo支持的递归组语法:

/\*(?>[^*/]+|\*[^/]|/[^*])*(?>(?R)(?>[^*/]+|\*[^/]|/[^*])*)*\*/

        

2> ridgerunner..：
不不不!没有其他人阅读掌握正则表达式(第3版)!？在此,Jeffrey Friedl检查了这个确切的问题,并以此为例(第272-276页)来说明他的"展开循环"技术.他对大多数正则表达式引擎的解决方案是这样的:

/\*[^*]*\*+(?:[^*/][^*]*\*+)*/

但是,如果正则表达式引擎被优化以处理惰性量词(如Perl的那样),则最有效的表达式更简单(如上所述):

/\*.*?\*/

(当然应用等效的's'"点匹配所有"修饰符.)请注意,我不使用.NET,所以我不能说哪个版本对于该引擎更快.



    

    

    
        推荐阅读
        
            
                                
                    
                        程序员
                        在android中动态设置状态栏颜色
                    

                    
                                                
                        如何解决《在android中动态设置状态栏颜色》经验，为你挑选了2个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Android-Skobbler不支持64位处理器
                    

                    
                                                
                        如何解决《Android-Skobbler不支持64位处理器》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        DIV:全高+滚动
                    

                    
                                                
                        如何解决《DIV:全高+滚动》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        为什么定义析构函数会删除隐式定义的移动赋值运算符？
                    

                    
                                                
                        如何解决《为什么定义析构函数会删除隐式定义的移动赋值运算符？》经验，为你挑选了2个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        UIImageView在启动屏幕上是黑色的
                    

                    
                                                
                            
                        
                                                
                        如何解决《UIImageView在启动屏幕上是黑色的》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        传递char**作为参数
                    

                    
                                                
                        如何解决《传递char**作为参数》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何与MongoDb C#Driver 2.1异步使用AsQueryable方法？
                    

                    
                                                
                        如何解决《如何与MongoDbC#Driver2.1异步使用AsQueryable方法？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        PolymerJS:Iron-Ajax  - 如何将令牌绑定到标题属性？
                    

                    
                                                
                            
                        
                                                
                        如何解决《PolymerJS:Iron-Ajax-如何将令牌绑定到标题属性？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Shell脚本使用不清楚":"
                    

                    
                                                
                        如何解决《Shell脚本使用不清楚":"》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        我怎样才能确保非法行为是不可行的？
                    

                    
                                                
                        如何解决《我怎样才能确保非法行为是不可行的？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        使用html2canvas将高图图表呈现为pdf不适用于IE和Firefox
                    

                    
                                                
                            
                        
                                                
                        如何解决《使用html2canvas将高图图表呈现为pdf不适用于IE和Firefox》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Postgres 9.4中JSON  - > JSONB列转换的速度大致有多快
                    

                    
                                                
                        如何解决《Postgres9.4中JSON->JSONB列转换的速度大致有多快》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Webpack和字体:模块解析失败
                    

                    
                                                
                        如何解决《Webpack和字体:模块解析失败》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        xamarin表单错误Droid.Resource不包含字符串的定义
                    

                    
                                                
                        如何解决《xamarin表单错误Droid.Resource不包含字符串的定义》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        对于Lollipop及以上的仪器测试,"没有测试结果"
                    

                    
                                                
                        如何解决《对于Lollipop及以上的仪器测试,"没有测试结果"》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何保存我的应用设置？
                    

                    
                                                
                        如何解决《如何保存我的应用设置？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        ASP.NET 5 RC1-Final中不存在UseWindowsAzureActiveDirectoryBearerAuthentication
                    

                    
                                                
                        如何解决《ASP.NET5RC1-Final中不存在UseWindowsAzureActiveDirectoryBearerAuthentication》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        GCC specs文件:如何获取安装路径
                    

                    
                                                
                        如何解决《GCCspecs文件:如何获取安装路径》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        禁用拼写检查但保留建议
                    

                    
                                                
                        如何解决《禁用拼写检查但保留建议》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        将SVG转换为PNG,将应用的图像作为svg元素的背景
                    

                    
                                                
                        如何解决《将SVG转换为PNG,将应用的图像作为svg元素的背景》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                

            
        
    

    
        吐了个 "CAO" !
        
            
                吐个槽吧,看都看了
            
            
                
                                        会员登录 | 用户注册
























    

    
        
            
            
                
                    
                
            

            
                臭小子            

            
                这个屌丝很懒，什么也没留下！            
            
            

                                
                    
                    关注作者
                            

        
    


    
        Tags | 热门标签
        
            
                                
                    actionscrip
                
                                
                    bash
                
                                
                    c#
                
                                
                    c++
                
                                
                    c语言
                
                                
                    erlang
                
                                
                    flutter
                
                                
                    go
                
                                
                    golang
                
                                
                    java
                
                                
                    javascript
                
                                
                    lua
                
                                
                    node.js
                
                                
                    perl
                
                                
                    php
                
                                
                    python
                
                                
                    scala
                
                                
                    typescript
                
                                
            
        
    


    
        RankList | 热门文章
        
            
                                
                    1添加Swift枚举大小写是否需要对主要semver版本进行更新？
                
                                
                    2将BIGSERIAL转换为BIGINT
                
                                
                    3Scikit Learn TfidfVectorizer:如何获得具有最高tf-idf分数的前n个术语
                
                                
                    4复杂化在定制时会冻结Apple Watch
                
                                
                    5为什么在JS中你不能在原型上设置非函数
                
                                
                    6静态只读字段和性能
                
                                
                    7如何告诉析构函数不被调用？
                
                                
                    8如何在制作Swift Command line工具时使用carthage库？
                
                                
                    9Tesseract在openCV Mat上失败(安装问题？)
                
                                
                    10声明具有相同类型的多个TypeScript变量
                
                                
                    11基于相同的索引连接两个列表
                
                                
                    12将行复制粘贴到Excel电子表格中,而不覆盖下面的现有内容
                
                                
                    13R中for循环的矢量化
                
                                
                    14使用Web worker预加载图像是否有优势？
                
                                
                    15将Python Opencv Image(numpy数组)转换为PyQt QPixmap图像
                
                                
                    16对于带数组的循环不起作用
                
                                
                    17C++字符串.为什么答案显示字符串"dog"大于"cat",那么"cat"大于"dog"？
                
                                
                    18在给定索引处添加值而不删除
                
                                
                    19jsPDF无法设置字体系列
                
                                
                    20从列表到data.table与hash的R快速单项查找