20赞

将正则表达式结合在红宝石中

作者：Chloemw | 2023-08-29 12:19

如何解决《将正则表达式结合在红宝石中》经验，为你挑选了1个好方法。

鉴于此文本:

    /* F004 (0309)00 */  
    /* field 1 */  
    /* field 2 */  
    /* F004 (0409)00 */  
    /* field 1 */  
    /* field 2 */

我如何解析它到这个数组:
[ ["F004"],["0309"],["/* field 1 */\n/* field 2 */"], ["F004"],["0409"],["/* field 1 */\n/* field 2 */"] ]

我有代码正在解析前两个项目:

form = /\/\*\s+(\w+)\s+\((\d{4})\)[0]{2}\s+\*\//m
text.scan(form)

[ ["F004"],["0309"], ["F004"],["0409"] ]

这里是我尝试解析所有三个并且失败并且无效的正则表达式错误的代码:

form = /\/\*\s+(\w+)\s+\((\d{4})\)[0]{2}\s+\*\//m
form_and_fields = /#{form}(.[^#{form}]+)/m
text.scan(form_and_fields)

编辑:这最终为我工作,感谢rampion和singpolyma:

form = /
  \/\*\s+(\w+)\s+\((\d+)\)\d+\s+\*\/    #formId & edDate
  (.+?)                                 #fieldText
  (?=\/\*\s+\w+\s+\(\d+\)\d+\s+\*\/|\Z) #stop at beginning of next form
                                        # or the end of the string
/mx
text.scan(form)

rampion.. 6

你似乎误解了角色类(例如[a-f0-9],或[^aeiouy])是如何工作的. /[^abcd]/并不否定模式abcd,它说:"相匹配,这不是任何字符'a'或'b'或'c'或'd'".

如果要匹配模式的否定,请使用/(?!pattern)/构造.这是一个零宽度匹配 - 意味着它实际上不匹配任何字符,它匹配一个位置.类似于如何/^/和/$/匹配字符串的开始和结束,或/\b/单词的边界匹配.例如:/(?!xx)/匹配模式"xx"未开始的每个位置.

通常,在使用模式否定之后,您需要匹配一些字符以在字符串中向前移动.

所以要使用你的模式:

form = /\/\*\s+(\w+)\s+\((\d{4})\)[0]{2}\s+\*\//m
form_and_fields = /#{form}((?:(?!#{form}).)+)/m
text.scan(form_and_fields)

从内到外(我将使用(?#comments))

(?!#{form}) 否定原始图案,因此它匹配原始图案无法启动的任何位置.

(?:(?!#{form}).)+表示在此之后匹配一个字符,并尽可能多次重试,但至少重复一次. (?:(?#whatever))是一个非捕获括号 - 适合分组.

在irb中,这给出了:

irb> text.scan(form_and_fields)
=> [["F004", "0309", "  \n    /* field 1 */  \n    /* field 2 */  \n    ", nil, nil], ["F004", "0409", "  \n    /* field 1 */  \n    /* field 2 */  \n", nil, nil]]

额外的nils来自form于在否定模式中使用的捕获组(?!#{form}),因此在成功匹配时不捕获任何内容.

这可以清理一些:

form_and_fields = /#{form}\s*(.+?)\s*(?:(?=#{form})|\Z)/m
text.scan(form_and_fields)

现在,我们使用零宽度正向前瞻(?=#{form})来匹配下一次出现的位置,而不是零宽度负前瞻form.所以在这个正则表达式中,我们匹配所有内容,直到下一次出现form(不包括我们的匹配中的下一个出现).这让我们可以修剪出一些字段周围的空白.我们还必须检查我们到达字符串末尾的情况 - /\Z/因为这也可能发生.

在irb:

irb> text.scan(form_and_fields)
=> [["F004", "0309", "/* field 1 */  \n    /* field 2 */", "F004", "0409"], ["F004", "0409", "/* field 1 */  \n    /* field 2 */", nil, nil]]

现在请注意,最后两个字段是第一次填充 - b/c零宽度正向前瞻中的捕获parens匹配的东西,即使它在过程中没有被标记为"消耗" - 这就是为什么这个位可以第二次重新比赛.

1> rampion..：

你似乎误解了角色类(例如[a-f0-9],或[^aeiouy])是如何工作的. /[^abcd]/并不否定模式abcd,它说:"相匹配,这不是任何字符'a'或'b'或'c'或'd'".

通常,在使用模式否定之后,您需要匹配一些字符以在字符串中向前移动.

所以要使用你的模式:

form = /\/\*\s+(\w+)\s+\((\d{4})\)[0]{2}\s+\*\//m
form_and_fields = /#{form}((?:(?!#{form}).)+)/m
text.scan(form_and_fields)

从内到外(我将使用(?#comments))

(?!#{form}) 否定原始图案,因此它匹配原始图案无法启动的任何位置.

(?:(?!#{form}).)+表示在此之后匹配一个字符,并尽可能多次重试,但至少重复一次. (?:(?#whatever))是一个非捕获括号 - 适合分组.

在irb中,这给出了:

irb> text.scan(form_and_fields)
=> [["F004", "0309", "  \n    /* field 1 */  \n    /* field 2 */  \n    ", nil, nil], ["F004", "0409", "  \n    /* field 1 */  \n    /* field 2 */  \n", nil, nil]]

额外的nils来自form于在否定模式中使用的捕获组(?!#{form}),因此在成功匹配时不捕获任何内容.

这可以清理一些:

form_and_fields = /#{form}\s*(.+?)\s*(?:(?=#{form})|\Z)/m
text.scan(form_and_fields)

在irb:

irb> text.scan(form_and_fields)
=> [["F004", "0309", "/* field 1 */  \n    /* field 2 */", "F004", "0409"], ["F004", "0409", "/* field 1 */  \n    /* field 2 */", nil, nil]]

推荐阅读

程序员
Android 6.0的bug？有权限,但getScanResults()仍然在Android 6.0中返回空列表

如何解决《Android6.0的bug？有权限,但getScanResults()仍然在Android6.0中返回空列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将backButton文本设置为空？

如何解决《如何将backButton文本设置为空？》经验，为你挑选了2个好方法。 ... [详细]
程序员
假对象与模拟对象

如何解决《假对象与模拟对象》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在Parse Cloud Code中保存批量数据？

如何解决《如何在ParseCloudCode中保存批量数据？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Spark Streaming + Kafka:SparkException:无法找到Set的前导偏移

如何解决《SparkStreaming+Kafka:SparkException:无法找到Set的前导偏移》经验，为你挑选了1个好方法。 ... [详细]
程序员
ITMS-90037提交应用商店时，Info.plist文件丢失或无法解析

如何解决《ITMS-90037提交应用商店时，Info.plist文件丢失或无法解析》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Clion中自动为.h文件生成函数头？

如何解决《如何在Clion中自动为.h文件生成函数头？》经验，为你挑选了0个好方法。 ... [详细]
程序员
在try-catch块之外访问变量

如何解决《在try-catch块之外访问变量》经验，为你挑选了2个好方法。 ... [详细]
程序员
读取输入的值返回undefined

如何解决《读取输入的值返回undefined》经验，为你挑选了1个好方法。 ... [详细]
程序员
在XCode中的UI测试期间无法访问自定义视图

如何解决《在XCode中的UI测试期间无法访问自定义视图》经验，为你挑选了1个好方法。 ... [详细]
程序员
通过CodePush或AppHub部署应用程序

如何解决《通过CodePush或AppHub部署应用程序》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法解码下载的字体,OTS解析错误:无效的版本标记+ rails 4

如何解决《无法解码下载的字体,OTS解析错误:无效的版本标记+rails4》经验，为你挑选了3个好方法。 ... [详细]
程序员
ES6作为angularjs或angular2的打字稿目标编译器选项

如何解决《ES6作为angularjs或angular2的打字稿目标编译器选项》经验，为你挑选了1个好方法。 ... [详细]
程序员
函数评估要求所有线程都运行-MVC

如何解决《函数评估要求所有线程都运行-MVC》经验，为你挑选了1个好方法。 ... [详细]
程序员
加速移动页面(AMP)中的SVG部分是否支持IMG标记？

如何解决《加速移动页面(AMP)中的SVG部分是否支持IMG标记？》经验，为你挑选了1个好方法。 ... [详细]
程序员
std :: move或std :: forward,参数为std :: unique_ptr <T> &&

如何解决《std::move或std::forward,参数为std::unique_ptr<T>&&》经验，为你挑选了1个好方法。 ... [详细]
程序员
铸造到'void'真的有什么作用？

如何解决《铸造到'void'真的有什么作用？》经验，为你挑选了2个好方法。 ... [详细]
程序员
Retrofit 2 RxJava - Gson - "全局"反序列化,更改响应类型

如何解决《Retrofit2RxJava-Gson-"全局"反序列化,更改响应类型》经验，为你挑选了1个好方法。 ... [详细]
程序员
请求匹配多个操作,导致ASP.NET 5/MVC 6中具有不同参数的操作不明确

如何解决《请求匹配多个操作,导致ASP.NET5/MVC6中具有不同参数的操作不明确》经验，为你挑选了0个好方法。 ... [详细]
程序员
R googleVis BubbleChart,设置大小而不设置颜色

如何解决《RgoogleVisBubbleChart,设置大小而不设置颜色》经验，为你挑选了0个好方法。 ... [详细]

Chloemw

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章