14赞

在python中拆分标签

作者：wangtao | 2023-08-30 13:24

如何解决《在python中拆分标签》经验，为你挑选了1个好方法。

我有一个文件包含这个:


  
     Hello! - {{ today }}
  
  
    {{ runner_up }} 
         avasd
         {{ blabla }}
        sdvas
        {{ oooo }}



什么是提取最好的或最Python的方式{{today}},{{runner_up}}等等？

我知道它可以通过分割/正则表达式完成,但我想知道是否还有其他方法.

PS:考虑加载在一个变量中的数据thedata.

编辑:我认为HTML示例很糟糕,因为它将一些评论者指向BeautifulSoup.所以,这是一个新的输入数据:

Fix grammatical or {{spelling}} errors.

Clarify meaning without changing it.

Correct minor {{mistakes}}.

Add related resources or links.

Always respect the original {{author}}.


输出:

spelling
mistakes
author

    
  




  
  
  

    

      

        Triptych..
         8
      
      
Mmkay,这里是一个似乎对我有用的发电机解决方案.如果您愿意,还可以提供不同的打开和关闭标签.

def get_tags(s, open_delim  ='{{', 
                close_delim ='}}' ):

   while True:

      # Search for the next two delimiters in the source text
      start = s.find(open_delim)
      end   = s.find(close_delim)

      # We found a non-empty match
      if -1 < start < end:

         # Skip the length of the open delimiter
         start += len(open_delim)

         # Spit out the tag
         yield s[start:end].strip()

         # Truncate string to start from last match
         s = s[end+len(close_delim):]

      else:
         return


针对您的目标输入运行,如下所示:

# prints: today, runner_up, blabla, oooo
for tag in get_tags(html):
    print tag


编辑:它也适用于你的新例子:).在我明显快速的测试中,它似乎也以合理的方式处理格式错误的标签,尽管我不保证其稳健性!


1> Triptych..：
Mmkay,这里是一个似乎对我有用的发电机解决方案.如果您愿意,还可以提供不同的打开和关闭标签.

def get_tags(s, open_delim  ='{{', 
                close_delim ='}}' ):

   while True:

      # Search for the next two delimiters in the source text
      start = s.find(open_delim)
      end   = s.find(close_delim)

      # We found a non-empty match
      if -1 < start < end:

         # Skip the length of the open delimiter
         start += len(open_delim)

         # Spit out the tag
         yield s[start:end].strip()

         # Truncate string to start from last match
         s = s[end+len(close_delim):]

      else:
         return


针对您的目标输入运行,如下所示:

# prints: today, runner_up, blabla, oooo
for tag in get_tags(html):
    print tag


编辑:它也适用于你的新例子:).在我明显快速的测试中,它似乎也以合理的方式处理格式错误的标签,尽管我不保证其稳健性!



    

    

    
        推荐阅读
        
            
                                
                    
                        程序员
                        推断Pandas DataFrame
                    

                    
                                                
                            
                        
                                                
                        如何解决《推断PandasDataFrame》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Facebook应用程序是否有通用URI方案,适用于所有移动设备？
                    

                    
                                                
                        如何解决《Facebook应用程序是否有通用URI方案,适用于所有移动设备？》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        铁路支付通过payumoney
                    

                    
                                                
                        如何解决《铁路支付通过payumoney》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Java获取下一个枚举值或从第一个开始
                    

                    
                                                
                        如何解决《Java获取下一个枚举值或从第一个开始》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        使用cmp在Python中排序()
                    

                    
                                                
                        如何解决《使用cmp在Python中排序()》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        X不是Y的成员类型
                    

                    
                                                
                            
                        
                                                
                        如何解决《X不是Y的成员类型》经验，为你挑选了2个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        在bash中将大块二进制分割为8位块
                    

                    
                                                
                        如何解决《在bash中将大块二进制分割为8位块》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        MongoDB  - 计算对象属性的嵌套数组的平均值
                    

                    
                                                
                        如何解决《MongoDB-计算对象属性的嵌套数组的平均值》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        从左侧CSS动画中滑入
                    

                    
                                                
                        如何解决《从左侧CSS动画中滑入》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        修改函数内的点(...)
                    

                    
                                                
                        如何解决《修改函数内的点()》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        使用角度常数
                    

                    
                                                
                        如何解决《使用角度常数》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        在Terminal/iTerm中使用HotKey切换不透明度
                    

                    
                                                
                        如何解决《在Terminal/iTerm中使用HotKey切换不透明度》经验，为你挑选了2个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        使用HAPROXY阻止HTTP方法
                    

                    
                                                
                        如何解决《使用HAPROXY阻止HTTP方法》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        光栅图像位于基础图层下方,而标记位于上方:xIndex被忽略
                    

                    
                                                
                        如何解决《光栅图像位于基础图层下方,而标记位于上方:xIndex被忽略》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        递归析构函数
                    

                    
                                                
                        如何解决《递归析构函数》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        将数据从内核空间复制到用户空间
                    

                    
                                                
                        如何解决《将数据从内核空间复制到用户空间》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        EF6中的嵌套事务行为
                    

                    
                                                
                        如何解决《EF6中的嵌套事务行为》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Specs2:如何测试具有多个注入依赖项的类？
                    

                    
                                                
                        如何解决《Specs2:如何测试具有多个注入依赖项的类？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        设置为DropDownList的DropDownStyle看起来已禁用，不是吗？
                    

                    
                                                
                            
                        
                                                
                        如何解决《设置为DropDownList的DropDownStyle看起来已禁用，不是吗？》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        序列化结构的STL映射
                    

                    
                                                
                        如何解决《序列化结构的STL映射》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                

            
        
    

    
        吐了个 "CAO" !
        
            
                吐个槽吧,看都看了
            
            
                
                                        会员登录 | 用户注册
























    

    
        
            
            
                
                    
                
            

            
                wangtao            

            
                这个屌丝很懒，什么也没留下！            
            
            

                                
                    
                    关注作者
                            

        
    


    
        Tags | 热门标签
        
            
                                
                    actionscrip
                
                                
                    bash
                
                                
                    c#
                
                                
                    c++
                
                                
                    c语言
                
                                
                    erlang
                
                                
                    flutter
                
                                
                    go
                
                                
                    golang
                
                                
                    java
                
                                
                    javascript
                
                                
                    lua
                
                                
                    node.js
                
                                
                    perl
                
                                
                    php
                
                                
                    python
                
                                
                    scala
                
                                
                    typescript
                
                                
            
        
    


    
        RankList | 热门文章
        
            
                                
                    1为每个处理器虚拟机设置最佳处理器/核心数(VMware)
                
                                
                    2如何获取具有继承宽度的元素的宽度？
                
                                
                    3android.hardware.Camera $ EventHandler.handleMessage
                
                                
                    4Google地图的宽度和高度
                
                                
                    5带有Gradle和Webpack的Spring Boot
                
                                
                    6Tableview首先重用单元格并显示错误数据
                
                                
                    7创建一系列不同长度的序列
                
                                
                    8快速评估大量输入值的数学表达式(函数)
                
                                
                    9包装使用基于事件的异步模式的库,用于Async/Await
                
                                
                    10有没有办法简单地将JSON数组值转换为javascript中的字符串
                
                                
                    11x:绑定设计时间问题
                
                                
                    12如何在chocolatey'.config'文件中使用自定义参数？
                
                                
                    13使用循环/递归镜像矩阵中的行？
                
                                
                    14AsyncTaskLoader无法启动
                
                                
                    15具有json类型字段的Laravel数据库在返回值时添加\"
                
                                
                    16命名空间"X"在命名空间"using:Y"中不存在
                
                                
                    17查看GitHub评论的原始Markdown
                
                                
                    18不能调用非函数类型'CIImage'的值吗？
                
                                
                    19扩展RColorBrewer以支持更多颜色？
                
                                
                    20如何合并两个分支,并自动忽略特定的文件/文件夹？