11赞

根据一组单词拆分字符串

作者：135369一生真爱_890 | 2023-09-09 15:02

如何解决《根据一组单词拆分字符串》经验，为你挑选了3个好方法。

我有一个像这样的字符串列表,

['happy_feet', 'happy_hats_for_cats', 'sad_fox_or_mad_banana','sad_pandas_and_happy_cats_for_people']

给定一个关键字列表,['for', 'or', 'and']我希望能够将列表解析为另一个列表,如果关键字列表出现在字符串中,则将该字符串拆分为多个部分.

例如,上面的集合将被拆分为

['happy_feet', 'happy_hats',  'cats', 'sad_fox', 'mad_banana', 'sad_pandas', 'happy_cats', 'people']

目前我已经通过下划线拆分每个内部字符串,并且有一个for循环查找关键字的索引,然后通过下划线重新组合字符串.有更快的方法吗？

1> Tim Pietzcke..：

>>> [re.split(r"_(?:f?or|and)_", s) for s in l]
[['happy_feet'],
 ['happy_hats', 'cats'],
 ['sad_fox', 'mad_banana'],
 ['sad_pandas', 'happy_cats', 'people']]

要将它们组合到一个列表中,您可以使用

result = []
for s in l:
    result.extend(re.split(r"_(?:f?or|and)_", s))

2> Joran Beasle..：

>>> pat = re.compile("_(?:%s)_"%"|".join(sorted(split_list,key=len)))
>>> list(itertools.chain(pat.split(line) for line in data))

将为您提供的示例数据集提供所需的输出

实际上,使用_分隔符,你真的不需要按长度排序,所以你可以这么做

>>> pat = re.compile("_(?:%s)_"%"|".join(split_list))
>>> list(itertools.chain(pat.split(line) for line in data))

3> Martijn Piet..：

您可以使用正则表达式:

from itertools import chain
import re

pattern = re.compile(r'_(?:{})_'.format('|'.join([re.escape(w) for w in keywords])))

result = list(chain.from_iterable(pattern.split(w) for w in input_list))

该模式是从您的关键字列表中动态创建的.该字符串'happy_hats_for_cats'分为'_for_':

>>> re.split(r'_for_', 'happy_hats_for_cats')
['happy_hats', 'cats']

但是因为我们实际上生成了一组备选方案(使用|元字符),您可以拆分任何关键字:

>>> re.split(r'_(?:for|or|and)_', 'sad_pandas_and_happy_cats_for_people')
['sad_pandas', 'happy_cats', 'people']

每个拆分结果都会为您提供一个字符串列表(如果没有任何内容可以拆分,则只有一个); 使用itertools.chain.from_iterable()让我们将所有这些列表视为一个长迭代.

演示:

>>> from itertools import chain
>>> import re
>>> keywords = ['for', 'or', 'and']
>>> input_list = ['happy_feet', 'happy_hats_for_cats', 'sad_fox_or_mad_banana','sad_pandas_and_happy_cats_for_people']
>>> pattern = re.compile(r'_(?:{})_'.format('|'.join([re.escape(w) for w in keywords])))    
>>> list(chain.from_iterable(pattern.split(w) for w in input_list))
['happy_feet', 'happy_hats', 'cats', 'sad_fox', 'mad_banana', 'sad_pandas', 'happy_cats', 'people']

推荐阅读

程序员
C#编译器是否转换并存储静态变量？

如何解决《C#编译器是否转换并存储静态变量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用php date函数显示不同于本地服务器时间的时间？

如何解决《如何使用phpdate函数显示不同于本地服务器时间的时间？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为github上的项目做贡献,如何"在主人之上重新调整我的拉取请求"

如何解决《为github上的项目做贡献,如何"在主人之上重新调整我的拉取请求"》经验，为你挑选了2个好方法。 ... [详细]
程序员
了解C中的静态存储类

如何解决《了解C中的静态存储类》经验，为你挑选了2个好方法。 ... [详细]
程序员
我如何在Python中迭代字母表,拜托？

如何解决《我如何在Python中迭代字母表,拜托？》经验，为你挑选了2个好方法。 ... [详细]
程序员
范围对象在内部将值更改为控制器范围时更新UI

如何解决《范围对象在内部将值更改为控制器范围时更新UI》经验，为你挑选了1个好方法。 ... [详细]
程序员
执行segue导航栏停留的位置和Tab Bar消失

如何解决《执行segue导航栏停留的位置和TabBar消失》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将大数组切成小数组

如何解决《如何将大数组切成小数组》经验，为你挑选了1个好方法。 ... [详细]
程序员
SCons-***未找到SConstruct文件

如何解决《SCons-***未找到SConstruct文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
ajax php javascript:使用POST方法时出错

如何解决《ajaxphpjavascript:使用POST方法时出错》经验，为你挑选了1个好方法。 ... [详细]
程序员
Hazelcast地图同步

如何解决《Hazelcast地图同步》经验，为你挑选了1个好方法。 ... [详细]
程序员
Application.Restart如何在.NET中运行？

如何解决《Application.Restart如何在.NET中运行？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在app delegate之外注册远程通知

如何解决《在appdelegate之外注册远程通知》经验，为你挑选了3个好方法。 ... [详细]
程序员
可以使用代码块作为C宏的参数吗？

如何解决《可以使用代码块作为C宏的参数吗？》经验，为你挑选了2个好方法。 ... [详细]
程序员
保留QTextEdit中的光标位置

如何解决《保留QTextEdit中的光标位置》经验，为你挑选了1个好方法。 ... [详细]
程序员
通过ruby OpenURI下载文件时间歇性EOFError

如何解决《通过rubyOpenURI下载文件时间歇性EOFError》经验，为你挑选了0个好方法。 ... [详细]
程序员
返回Mvc.JsonResult并设置Response.StatusCode

如何解决《返回Mvc.JsonResult并设置Response.StatusCode》经验，为你挑选了1个好方法。 ... [详细]
程序员
取消定义在定义值之前在Enum中定义int变量

如何解决《取消定义在定义值之前在Enum中定义int变量》经验，为你挑选了1个好方法。 ... [详细]
程序员
Xcode自动完成以显示"包含"而非"开始时"的建议

如何解决《Xcode自动完成以显示"包含"而非"开始时"的建议》经验，为你挑选了0个好方法。 ... [详细]
程序员
RxJS教程不假设熟悉反应式编程概念或Rx .NET？

如何解决《RxJS教程不假设熟悉反应式编程概念或Rx.NET？》经验，为你挑选了1个好方法。 ... [详细]

135369一生真爱_890

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章