我以犯罪效率低下的方式使用Python正则表达式

作者：牛尾巴2010 | 2023-09-04 18:09

如何解决《我以犯罪效率低下的方式使用Python正则表达式》经验，为你挑选了1个好方法。

我的目标是创建一个非常简单的模板语言.目前,我正在使用值替换变量,如下所示:

这个输入:

网络

应该产生这个输出:

Web这是一个测试变量

我有它的工作.但是看着我的代码,我在相同的字符串上运行多个相同的正则表达式 - 这只是冒犯了我的效率感.必须有更好,更Pythonic的方式.(这是真正冒犯的两个"while"循环.)

这确实通过了单元测试,所以如果这是愚蠢的过早优化,请告诉我 - 我愿意放手.在文档中可能有许多这些变量定义和用法,但不是数百个.但我怀疑(对其他人)显而易见的改善方法,我很好奇StackOverflow人群会想出什么.

def stripMatchedQuotes(item):
    MatchedSingleQuotes = re.compile(r"'(.*)'", re.LOCALE)
    MatchedDoubleQuotes = re.compile(r'"(.*)"', re.LOCALE)
    item = MatchedSingleQuotes.sub(r'\1', item, 1)
    item = MatchedDoubleQuotes.sub(r'\1', item, 1)
    return item




def processVariables(item):
    VariableDefinition = re.compile(r'<%(.*?)=(.*?)%>', re.LOCALE)
    VariableUse = re.compile(r'<%(.*?)%>', re.LOCALE)
    Variables={}

    while VariableDefinition.search(item):
        VarName, VarDef = VariableDefinition.search(item).groups()
        VarName = stripMatchedQuotes(VarName).upper().strip()
        VarDef = stripMatchedQuotes(VarDef.strip())
        Variables[VarName] = VarDef
        item = VariableDefinition.sub('', item, 1)

    while VariableUse.search(item):
        VarName = stripMatchedQuotes(VariableUse.search(item).group(1).upper()).strip()
        item = VariableUse.sub(Variables[VarName], item, 1)

    return item

Brian.. 10

可能改进的第一件事是将re.compile移到函数之外.编译是缓存的,但检查它是否有速度命中,以查看它是否已编译.

另一种可能性是使用单个正则表达式如下:

MatchedQuotes = re.compile(r"(['\"])(.*)\1", re.LOCALE)
item = MatchedQuotes.sub(r'\2', item, 1)

最后,您可以将其组合到processVariables中的正则表达式中.考虑到Torsten Marek建议使用re.sub函数,这可以显着改善和简化事物.

VariableDefinition = re.compile(r'<%(["\']?)(.*?)\1=(["\']?)(.*?)\3%>', re.LOCALE)
VarRepl = re.compile(r'<%(["\']?)(.*?)\1%>', re.LOCALE)

def processVariables(item):
    vars = {}
    def findVars(m):
        vars[m.group(2).upper()] = m.group(4)
        return ""

    item = VariableDefinition.sub(findVars, item)
    return VarRepl.sub(lambda m: vars[m.group(2).upper()], item)

print processVariables('<%"TITLE"="This Is A Test Variable"%>The Web <%"TITLE"%>')

以下是我100000次运行的时间:

Original       : 13.637
Global regexes : 12.771
Single regex   :  9.095
Final version  :  1.846

[编辑]添加缺少的非贪婪说明符

[Edit2]添加.upper()调用,使其不像原始版本那样不区分大小写

1> Brian..：

可能改进的第一件事是将re.compile移到函数之外.编译是缓存的,但检查它是否有速度命中,以查看它是否已编译.

另一种可能性是使用单个正则表达式如下:

MatchedQuotes = re.compile(r"(['\"])(.*)\1", re.LOCALE)
item = MatchedQuotes.sub(r'\2', item, 1)

最后,您可以将其组合到processVariables中的正则表达式中.考虑到Torsten Marek建议使用re.sub函数,这可以显着改善和简化事物.

VariableDefinition = re.compile(r'<%(["\']?)(.*?)\1=(["\']?)(.*?)\3%>', re.LOCALE)
VarRepl = re.compile(r'<%(["\']?)(.*?)\1%>', re.LOCALE)

def processVariables(item):
    vars = {}
    def findVars(m):
        vars[m.group(2).upper()] = m.group(4)
        return ""

    item = VariableDefinition.sub(findVars, item)
    return VarRepl.sub(lambda m: vars[m.group(2).upper()], item)

print processVariables('<%"TITLE"="This Is A Test Variable"%>The Web <%"TITLE"%>')

以下是我100000次运行的时间:

Original       : 13.637
Global regexes : 12.771
Single regex   :  9.095
Final version  :  1.846

[编辑]添加缺少的非贪婪说明符

[Edit2]添加.upper()调用,使其不像原始版本那样不区分大小写

推荐阅读

程序员
读取字符串并与特定值进行比较

如何解决《读取字符串并与特定值进行比较》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法在C++中的for循环条件语句中使用vector.size()

如何解决《无法在C++中的for循环条件语句中使用vector.size()》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用carthage集成ReactiveCocoa失败

如何解决《使用carthage集成ReactiveCocoa失败》经验，为你挑选了1个好方法。 ... [详细]
程序员
将过滤器应用于WordPress短代码输出

如何解决《将过滤器应用于WordPress短代码输出》经验，为你挑选了1个好方法。 ... [详细]
程序员
与填充的传单边界

如何解决《与填充的传单边界》经验，为你挑选了1个好方法。 ... [详细]
程序员
EMV离线批准/拒绝

如何解决《EMV离线批准/拒绝》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何测试ViewController的Deinit

如何解决《如何测试ViewController的Deinit》经验，为你挑选了0个好方法。 ... [详细]
程序员
Logicify jQuery位置选择器插件 - 以编程方式设置位置

如何解决《LogicifyjQuery位置选择器插件-以编程方式设置位置》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何让inputAccessoryView锚定在UITabBar之上？

如何解决《如何让inputAccessoryView锚定在UITabBar之上？》经验，为你挑选了0个好方法。 ... [详细]
程序员
在bash脚本中从grep打印输出会产生损坏的字符串

如何解决《在bash脚本中从grep打印输出会产生损坏的字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
在使用redux构建React应用程序时,何处存储WebRTC流

如何解决《在使用redux构建React应用程序时,何处存储WebRTC流》经验，为你挑选了1个好方法。 ... [详细]
程序员
"在arraylist构造函数中没有为add(java.lang.String)找到合适的方法吗？

如何解决《"在arraylist构造函数中没有为add(java.lang.String)找到合适的方法吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
rails link_to使用get而不是post

如何解决《railslink_to使用get而不是post》经验，为你挑选了1个好方法。 ... [详细]
程序员
Rmarkdown - 在文档中运行代码并显示错误

如何解决《Rmarkdown-在文档中运行代码并显示错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Ubuntu 15.04上使用Mono导入库错误

如何解决《在Ubuntu15.04上使用Mono导入库错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
传递属于self的函数是否会在不在闭包中时导致保留周期？

如何解决《传递属于self的函数是否会在不在闭包中时导致保留周期？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用python Bokeh分组条形图更改条形宽度？

如何解决《使用pythonBokeh分组条形图更改条形宽度？》经验，为你挑选了1个好方法。 ... [详细]
程序员
ggplotting时,有序数据帧的顺序不同

如何解决《ggplotting时,有序数据帧的顺序不同》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用类中的函数初始化变量

如何解决《使用类中的函数初始化变量》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在flexbox中以不同方式对齐特定的<div>？

如何解决《如何在flexbox中以不同方式对齐特定的<div>？》经验，为你挑选了0个好方法。 ... [详细]

牛尾巴2010

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章