14赞

转换为状态机的正则表达式的简短示例？

作者：手机用户2402852387 | 2023-08-30 20:43

如何解决《转换为状态机的正则表达式的简短示例？》经验，为你挑选了3个好方法。

在Stack Overflow播客#36(http://blog.stackoverflow.com/2009/01/podcast-36/)中,有人表达了这样的观点:一旦你理解了设置状态机是多么容易,你就会知道永远不要试图不恰当地使用正则表达式.

我做了很多搜索.我发现了一些学术论文和其他复杂的例子,但我想找一个简单的例子来帮助我理解这个过程.我使用了很多正则表达式,我想确保我永远不再使用"不恰当".

1> paxdiablo..：

当然,虽然你需要更复杂的例子来真正理解RE的工作原理.考虑以下RE:

^[A-Za-z][A-Za-z0-9_]*$

这是一个典型的标识符(必须以alpha开头,后面可以包含任意数量的字母数字和非字符字符,包括无字符).以下伪代码显示了如何使用有限状态机完成此操作:

state = FIRSTCHAR
for char in all_chars_in(string):
    if state == FIRSTCHAR:
            if char is not in the set "A-Z" or "a-z":
                error "Invalid first character"
            state = SUBSEQUENTCHARS
            next char
    if state == SUBSEQUENTCHARS:
            if char is not in the set "A-Z" or "a-z" or "0-9" or "_":
                error "Invalid subsequent character"
            state = SUBSEQUENTCHARS
            next char

现在,正如我所说,这是一个非常简单的例子.它没有说明如何进行贪婪/不一致的匹配,回溯,一行(而不是整行)的匹配以及RE语法容易处理的状态机的其他更深奥的功能.

这就是REs如此强大的原因.执行单线程RE可以执行的实际有限状态机代码通常非常长且复杂.

你可以做的最好的事情是获取一些特定简单语言的lex/yacc(或等效)代码的副本,并查看它生成的代码.它并不漂亮(它不一定是因为它不应该由人类阅读,它们应该是在查看lex/yacc代码),但它可以让你更好地了解它们是如何工作的.

2> ʞɔıu..：

一个相当方便的方法来帮助查看这个在任何模式上使用python的鲜为人知的re.DEBUG标志:

>>> re.compile(r'<([A-Z][A-Z0-9]*)\b[^>]*>(.*?)', re.DEBUG)
literal 60
subpattern 1
  in
    range (65, 90)
  max_repeat 0 65535
    in
      range (65, 90)
      range (48, 57)
at at_boundary
max_repeat 0 65535
  not_literal 62
literal 62
subpattern 2
  min_repeat 0 65535
    any None
literal 60
literal 47
groupref 1
literal 62

'literal'和'range'之后的数字是指它们应该匹配的ascii字符的整数值.

3> James Brady..：

动起来做自己的!

HTTP://osteele.com/tools/reanimator/ ???

有限状态机

这是一个非常好的拼凑工具,可以将正则表达式可视化为FSM.它不支持您在现实世界正则表达式引擎中找到的某些语法,但肯定足以准确理解正在发生的事情.

不幸的是,该工具似乎已被打破.

推荐阅读

程序员
在Haxe正则表达式中是否有与Java的\ p {Punct}等价的东西？

如何解决《在Haxe正则表达式中是否有与Java的\p{Punct}等价的东西？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何像素化和取消UIImage或UIImageview的像素化？

如何解决《如何像素化和取消UIImage或UIImageview的像素化？》经验，为你挑选了1个好方法。 ... [详细]
程序员
带别名的Hibernate查询

如何解决《带别名的Hibernate查询》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在chrome中使用带有HTTPS的BurpSuite代理

如何解决《如何在chrome中使用带有HTTPS的BurpSuite代理》经验，为你挑选了2个好方法。 ... [详细]
程序员
iOS 9如何检测静音模式？

如何解决《iOS9如何检测静音模式？》经验，为你挑选了1个好方法。 ... [详细]
程序员
C++ 11如何在atomic :: store和atomic :: load中观察内存顺序

如何解决《C++11如何在atomic::store和atomic::load中观察内存顺序》经验，为你挑选了0个好方法。 ... [详细]
程序员
在flavor中使用不同的applicationID时的数据绑定错误

如何解决《在flavor中使用不同的applicationID时的数据绑定错误》经验，为你挑选了0个好方法。 ... [详细]
程序员
Swift三元运算符函数调用？

如何解决《Swift三元运算符函数调用？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Symfony 2.8和3.0中找不到资产

如何解决《在Symfony2.8和3.0中找不到资产》经验，为你挑选了2个好方法。 ... [详细]
程序员
在R-studio中使用Git:无法修改代码文件

如何解决《在R-studio中使用Git:无法修改代码文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Meteor的一个函数中使用.find().fetch()

如何解决《在Meteor的一个函数中使用.find().fetch()》经验，为你挑选了1个好方法。 ... [详细]
程序员
未捕获的SyntaxError:nodejs中的意外标记<

如何解决《未捕获的SyntaxError:nodejs中的意外标记<》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Makefile中创建模式规则依赖项可选？

如何解决《如何在Makefile中创建模式规则依赖项可选？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为每个处理器虚拟机设置最佳处理器/核心数(VMware)

如何解决《为每个处理器虚拟机设置最佳处理器/核心数(VMware)》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何获取具有继承宽度的元素的宽度？

如何解决《如何获取具有继承宽度的元素的宽度？》经验，为你挑选了0个好方法。 ... [详细]
程序员
android.hardware.Camera $ EventHandler.handleMessage

如何解决《android.hardware.Camera$EventHandler.handleMessage》经验，为你挑选了2个好方法。 ... [详细]
程序员
Google地图的宽度和高度

如何解决《Google地图的宽度和高度》经验，为你挑选了1个好方法。 ... [详细]
程序员
带有Gradle和Webpack的Spring Boot

如何解决《带有Gradle和Webpack的SpringBoot》经验，为你挑选了0个好方法。 ... [详细]
程序员
Tableview首先重用单元格并显示错误数据

如何解决《Tableview首先重用单元格并显示错误数据》经验，为你挑选了1个好方法。 ... [详细]
程序员
创建一系列不同长度的序列

如何解决《创建一系列不同长度的序列》经验，为你挑选了1个好方法。 ... [详细]

手机用户2402852387

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章