7赞

更优雅的方式来实现类似regexp的量词

作者：勤奋的瞌睡猪_715 | 2023-09-06 17:46

如何解决《更优雅的方式来实现类似regexp的量词》经验，为你挑选了1个好方法。

我正在写一个简单的字符串解析器,它允许类似regexp的量词.输入字符串可能如下所示:

s = "x y{1,2} z"



我的解析器函数将此字符串转换为元组列表: 

list_of_tuples = [("x", 1, 1), ("y", 1, 2), ("z", 1, 1)]


现在,棘手的一点是我需要一个由量化指定的所有有效组合的列表.组合都必须具有相同数量的元素,并且该值None用于填充.对于给定的示例,预期输出为

[["x", "y", None, "z"], ["x", "y", "y", "z"]]


我确实有一个可行的解决方案,但我对它并不满意:它使用两个嵌套for循环,我发现代码有点模糊,所以有一些尴尬和笨拙的事情:

import itertools

def permute_input(lot):
    outer = []
    # is there something that replaces these nested loops?
    for val, start, end in lot:
        inner = []
        # For each tuple, create a list of constant length
        # Each element contains a different number of 
        # repetitions of the value of the tuple, padded
        # by the value None if needed.
        for i in range(start, end + 1):
            x = [val] * i + [None] * (end - i)
            inner.append(x)
        outer.append(inner)
    # Outer is now a list of lists.

    final = []
    # use itertools.product to combine the elements in the
    # list of lists:
    for combination in itertools.product(*outer):
        # flatten the elements in the current combination,
        # and append them to the final list:
        final.append([x for x 
                    in itertools.chain.from_iterable(combination)])
    return final

print(permute_input([("x", 1, 1), ("y", 1, 2), ("z", 1, 1)]))
[['x', 'y', None, 'z'], ['x', 'y', 'y', 'z']]


我怀疑这样做有一种更优雅的方式,可能隐藏在itertools模块的某个地方？


1> alecxe..：
解决该问题的另一种方法是使用pyparsing此示例正则表达式解析器,它将正则表达式扩展为可能的匹配字符串.对于您的x y{1,2} z示例字符串,它将生成两个可能的字符串来扩展量词:

$ python -i regex_invert.py 
>>> s = "x y{1,2} z"
>>> for item in invert(s):
...     print(item)
... 
x y z
x yy z


重复本身同时支持开放范围和封闭范围,并定义为:

repetition = (
    (lbrace + Word(nums).setResultsName("count") + rbrace) |
    (lbrace + Word(nums).setResultsName("minCount") + "," + Word(nums).setResultsName("maxCount") + rbrace) |
    oneOf(list("*+?"))
)




为了得到期望的结果,我们应该修改从recurseList生成器和返回列表而不是字符串中产生结果的方式:

for s in elist[0].makeGenerator()():
    for s2 in recurseList(elist[1:]):
        yield [s] + [s2]  # instead of yield s + s2


然后,我们只需要展平结果:

$ ipython3 -i regex_invert.py 

In [1]: import collections

In [2]: def flatten(l):
   ...:     for el in l:
   ...:         if isinstance(el, collections.Iterable) and not isinstance(el, (str, bytes)):
   ...:             yield from flatten(el)
   ...:         else:
   ...:             yield el
   ...:             

In [3]: s = "x y{1,2} z"

In [4]: for option in invert(s):
   ...:     print(list(flatten(option)))
   ...: 
['x', ' ', 'y', None, ' ', 'z']
['x', ' ', 'y', 'y', ' ', 'z']


然后,如果需要,您可以过滤空白字符:

In [5]: for option in invert(s):
   ...:     print([item for item in flatten(option) if item != ' '])
   ...:     
['x', 'y', None, 'z']
['x', 'y', 'y', 'z']



    

    

    
        推荐阅读
        
            
                                
                    
                        程序员
                        如何重命名插件标题> Wordpress>仪表板
                    

                    
                                                
                            
                        
                                                
                        如何解决《如何重命名插件标题>Wordpress>仪表板》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Vim/Sed:仅删除单个空行
                    

                    
                                                
                        如何解决《Vim/Sed:仅删除单个空行》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        使用ACL"public-read"保存到s3时,带有AdministratorAccess的AWS Lambda会抛出"拒绝访问"
                    

                    
                                                
                            
                        
                                                
                        如何解决《使用ACL"public-read"保存到s3时,带有AdministratorAccess的AWSLambda会抛出"拒绝访问"》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        在Android上使用Dagger 2进行懒惰注射
                    

                    
                                                
                        如何解决《在Android上使用Dagger2进行懒惰注射》经验，为你挑选了2个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        使用AJAX加载RSS提要:Google Feed API的替代方案？
                    

                    
                                                
                        如何解决《使用AJAX加载RSS提要:GoogleFeedAPI的替代方案？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        IE11 HTTPS AJAX XMLHttpRequest:网络错误0x2eff,由于错误00002eff无法完成操作
                    

                    
                                                
                        如何解决《IE11HTTPSAJAXXMLHttpRequest:网络错误0x2eff,由于错误00002eff无法完成操作》经验，为你挑选了2个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        可以通过"添加服务引用"添加RESTful WCF服务吗？
                    

                    
                                                
                        如何解决《可以通过"添加服务引用"添加RESTfulWCF服务吗？》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        编译com.squareup.retrofit时出错:converter-simplexml:2.0.0-beta2
                    

                    
                                                
                        如何解决《编译com.squareup.retrofit时出错:converter-simplexml:2.0.0-beta2》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        使用Babel在ES6(7？)中避免使用.bind
                    

                    
                                                
                        如何解决《使用Babel在ES6(7？)中避免使用.bind》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Java中的简单递归出错
                    

                    
                                                
                        如何解决《Java中的简单递归出错》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        使用Angularjs中的pdfMake从HTML生成PDF
                    

                    
                                                
                        如何解决《使用Angularjs中的pdfMake从HTML生成PDF》经验，为你挑选了2个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        python:试图理解"子进程"O/S调用
                    

                    
                                                
                        如何解决《python:试图理解"子进程"O/S调用》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        FullCalendar在周时间线视图中隐藏时间
                    

                    
                                                
                        如何解决《FullCalendar在周时间线视图中隐藏时间》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        超薄3黑色错误
                    

                    
                                                
                        如何解决《超薄3黑色错误》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        c#到vb.net转换 -  Action(Of T,string)作为元组项
                    

                    
                                                
                        如何解决《c#到vb.net转换-Action(OfT,string)作为元组项》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        将json格式的Chrome书签文件转换为html
                    

                    
                                                
                        如何解决《将json格式的Chrome书签文件转换为html》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        TensorFlow random_shuffle_queue已关闭且元素不足
                    

                    
                                                
                        如何解决《TensorFlowrandom_shuffle_queue已关闭且元素不足》经验，为你挑选了2个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        从postgres日期提取周数
                    

                    
                                                
                        如何解决《从postgres日期提取周数》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        嵌套列表中的min/max函数如何工作？
                    

                    
                                                
                        如何解决《嵌套列表中的min/max函数如何工作？》经验，为你挑选了2个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        NSNotification不会调用@selector方法
                    

                    
                                                
                        如何解决《NSNotification不会调用@selector方法》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                

            
        
    

    
        吐了个 "CAO" !
        
            
                吐个槽吧,看都看了
            
            
                
                                        会员登录 | 用户注册
























    

    
        
            
            
                
                    
                
            

            
                勤奋的瞌睡猪_715            

            
                这个屌丝很懒，什么也没留下！            
            
            

                                
                    
                    关注作者
                            

        
    


    
        Tags | 热门标签
        
            
                                
                    actionscrip
                
                                
                    bash
                
                                
                    c#
                
                                
                    c++
                
                                
                    c语言
                
                                
                    erlang
                
                                
                    flutter
                
                                
                    go
                
                                
                    golang
                
                                
                    java
                
                                
                    javascript
                
                                
                    lua
                
                                
                    node.js
                
                                
                    perl
                
                                
                    php
                
                                
                    python
                
                                
                    scala
                
                                
                    typescript
                
                                
            
        
    


    
        RankList | 热门文章
        
            
                                
                    1形式在angular2
                
                                
                    2如何在swift中打印数组中的对象值,而不是它的位置
                
                                
                    3Swift的异构值类型数组如何工作？
                
                                
                    4如何覆盖RecyclerView Adapter的notifyDataSetChanged,notifyItemChanged ...方法
                
                                
                    5删除排队的作业在Laravel 5
                
                                
                    6什么是SSO(例如SAML)中使用的RelayState参数？
                
                                
                    7如何让git-diff忽略所有的空白变化而忽略一个？
                
                                
                    8Sinon JS:有没有办法在sinon js中对对象参数的键值存根方法
                
                                
                    9Winston记录器文件名错误未定义
                
                                
                    10PHP 7.0.1无法加载ini文件
                
                                
                    11写入BinaryWriter时的类型大小
                
                                
                    12rails数据库连接池的工作原理
                
                                
                    13如何通过单个NPM脚本获取node-sass监视和实时重新加载？
                
                                
                    14AND运算符不使用MySQL在PHP函数中工作
                
                                
                    15是否有超级标记逗号的Unicode符号？
                
                                
                    16为什么JavaScript中的"〜undefined"为-1？
                
                                
                    17扩展&:将任何班级悬停在任何其他班级的SASS或SCSS中
                
                                
                    18如何延迟div中背景图像的显示
                
                                
                    19Android:我们如何在xml布局中隐藏/显示浮动操作按钮(fab)
                
                                
                    20使用phonegap或cordova获取当前电池电量？