是否有一种优雅的方式(最好是pythonic)来检查String s是否是一组L的子集的元素串联?L的元素可能在s中出现不止一次.
例如:
L = set(["a", "ab", "c", "e"])
然后"abac"是L的子集的元素的有效串联
"aaaaaaa"也是一种有效的连接.
但"广告"不是因为"d"不在L.
import re L = ["no", "force", "in", "the", "verse", "can", "stop", "me"] # make this: "(?:no|force|in|the|verse|can|stop|me)*$" r = re.compile( "(?:" + "|".join(L) + ")*$") r.match("shiny") # -> None r.match("canme") # -> not None
这适用于给定的字符串集.re
库中有一个函数可以引用字符串(转义 |
等),以便您可以在运行时安全地创建这样的表达式.
r = re.compile( "(?:" + "|".join( re.escape(s) for s in L) + ")*$" )
无论子串出现多少次,它都会匹配; 如果某些字符串是其他字符串的前缀,则可能会出现奇怪的结果,等等.它可能有令人讨厌的运行时.如果所有字符串在开头都很容易区分,那就不应该.