我正在尝试从EBML定义中提取所有匹配,如下所示:
| + A track | + Track number: 3 | + Track UID: 724222477 | + Track type: subtitles ... | + Language: eng ... | + A track | + Track number: 4 | + Track UID: 745646561 | + Track type: subtitles ... | + Language: jpn ...
我希望所有出现的"语言:???" 当前面有"Track type:subtitles".我尝试了几种变体:
Track type: subtitles.*Language: (\w\w\w)
我在Ruby中使用多行修饰符,因此它匹配换行符(如其他语言中的's'修饰符).
这有助于获得最后一次出现,在上面的例子中,它将是'jpn',例如:
string.scan(/Track type: subtitles.*Language: (\w\w\w)/m) => [["jpn"]]
结果我想:
=> [["eng"], ["jpn"]]
什么是正确的正则表达式来实现这一目标?
你需要通过改变这个来使你的正则表达式变得非贪婪:
.*
对此:
.*?
你的正则表达式是从第一次出现Track type: subtitles
到最后出现的匹配Language: (\w\w\w)
.使它非贪婪将起作用,因为它匹配尽可能少的字符.