16赞

在Python中缓存已编译的正则表达式对象？

作者：吻过彩虹的脸_378 | 2023-09-05 16:27

如何解决《在Python中缓存已编译的正则表达式对象？》经验，为你挑选了1个好方法。

每次导入包含大量静态正则表达式的python文件时,都会花费cpu周期将字符串编译到内存中的代表状态机中.

a = re.compile("a.*b")
b = re.compile("c.*d")
...

问题:是否可以以预编译的方式将这些正则表达式存储在磁盘上的缓存中,以避免在每次导入时执行正则表达式编译？

腌制对象只需执行以下操作,无论如何都会导致编译:

>>> import pickle
>>> import re
>>> x = re.compile(".*")
>>> pickle.dumps(x)
"cre\n_compile\np0\n(S'.*'\np1\nI0\ntp2\nRp3\n."

而re对象是unmarshallable:

>>> import marshal
>>> import re
>>> x = re.compile(".*")
>>> marshal.dumps(x)
Traceback (most recent call last):
  File "", line 1, in 
ValueError: unmarshallable object

John Milliki.. 13

是否可以以预编译的方式将这些正则表达式存储在磁盘上的缓存中,以避免在每次导入时执行正则表达式编译？

不容易.您必须编写一个挂钩到srePython正则表达式引擎的C 实现的自定义序列化程序.所需的时间和精力将大大超过任何性能优势.

首先,你有没有实际剖析代码？我怀疑编译正则表达式是应用程序运行时的重要部分.请记住,它们仅在第一次在当前执行中导入模块时进行编译 - 此后,模块及其属性将缓存在内存中.

如果你有一个基本上产生一次的程序,编译一堆正则表达式然后退出,你可以尝试重新设计它以在一次调用中执行多个测试.然后你可以重新使用正则表达式,如上所述.

最后,您可以将正则表达式编译为基于C的状态机,然后将它们与扩展模块链接.虽然这可能更难维护,但它将完全从您的应用程序中消除正则表达式编译.

1> John Milliki..：

是否可以以预编译的方式将这些正则表达式存储在磁盘上的缓存中,以避免在每次导入时执行正则表达式编译？

不容易.您必须编写一个挂钩到srePython正则表达式引擎的C 实现的自定义序列化程序.所需的时间和精力将大大超过任何性能优势.

最后,您可以将正则表达式编译为基于C的状态机,然后将它们与扩展模块链接.虽然这可能更难维护,但它将完全从您的应用程序中消除正则表达式编译.

推荐阅读

程序员
WKWebView scrollview委托

如何解决《WKWebViewscrollview委托》经验，为你挑选了1个好方法。 ... [详细]
程序员
Magento中的CSV导入/导出问题

如何解决《Magento中的CSV导入/导出问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在R图轴标签中使用斜体

如何解决《如何在R图轴标签中使用斜体》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在HTML中链接JavaScript程序并使其运行？

如何解决《如何在HTML中链接JavaScript程序并使其运行？》经验，为你挑选了1个好方法。 ... [详细]
程序员
AWS API-Gateway与SNS通信

如何解决《AWSAPI-Gateway与SNS通信》经验，为你挑选了2个好方法。 ... [详细]
程序员
在Intellij IDEA,PhpStorm或WebStorm中导入设置

如何解决《在IntellijIDEA,PhpStorm或WebStorm中导入设置》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以通过datastax驱动程序向Cssandra集群提交CQL脚本？

如何解决《是否可以通过datastax驱动程序向Cssandra集群提交CQL脚本？》经验，为你挑选了0个好方法。 ... [详细]
程序员
控制器上的多个路由

如何解决《控制器上的多个路由》经验，为你挑选了1个好方法。 ... [详细]
程序员
ORA-01810:格式代码出现两次

如何解决《ORA-01810:格式代码出现两次》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用ID作为名称从json对象创建强类型c#对象

如何解决《使用ID作为名称从json对象创建强类型c#对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法识别的命令行选项"-std = c ++ 11"

如何解决《无法识别的命令行选项"-std=c++11"》经验，为你挑选了1个好方法。 ... [详细]
程序员
在iOS中的UITableViewCell中,setHighlighted和setSelected有什么区别？

如何解决《在iOS中的UITableViewCell中,setHighlighted和setSelected有什么区别？》经验，为你挑选了1个好方法。 ... [详细]
程序员
错误：无法完成Gradle执行。原因：未知的命令行选项“ -X”

如何解决《错误：无法完成Gradle执行。原因：未知的命令行选项“-X”》经验，为你挑选了1个好方法。 ... [详细]
程序员
在data.table上使用geosphere distm函数来计算距离

如何解决《在data.table上使用geospheredistm函数来计算距离》经验，为你挑选了1个好方法。 ... [详细]
程序员
从Python NLTK调用斯坦福NER崩溃

如何解决《从PythonNLTK调用斯坦福NER崩溃》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使$ q等待多个异步任务？

如何解决《如何使$q等待多个异步任务？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Dockerfile:将RUN指令输出到变量中

如何解决《Dockerfile:将RUN指令输出到变量中》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用node.js child_process调用python脚本

如何解决《使用node.jschild_process调用python脚本》经验，为你挑选了1个好方法。 ... [详细]
程序员
Pyspark RDD首先收集163排

如何解决《PysparkRDD首先收集163排》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android蓝牙低功耗代码兼容API> = 21 AND API <21

如何解决《Android蓝牙低功耗代码兼容API>=21ANDAPI<21》经验，为你挑选了1个好方法。 ... [详细]

吻过彩虹的脸_378

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章