5赞

python,正则表达式分裂和特殊字符

作者：ar_wen2402851455 | 2023-08-29 13:16

如何解决《python,正则表达式分裂和特殊字符》经验，为你挑选了1个好方法。

如何使用空格作为分隔符正确分割包含具有特殊字符的句子的字符串？使用正则表达式分割方法我无法获得所需的结果.

示例代码:

# -*- coding: utf-8 -*-
import re


s="La felicità è tutto" # "The happiness is everything" in italian
l=re.compile("(\W)").split(s)

print " s> "+s
print " wordlist> "+str(l)
for i in l:
    print " word> "+i

输出是:

 s> La felicità è tutto
 wordlist> ['La', ' ', 'felicit', '\xc3', '', '\xa0', '', ' ', '', '\xc3', '', '\xa8', '', ' ', 'tutto']
 word> La
 word>  
 word> felicit
 word> Ã
 word> 
 word> ?
 word> 
 word>  
 word> 
 word> Ã
 word> 
 word> ?
 word> 
 word>  
 word> tutto

而我正在寻找一个输出:

 s> La felicità è tutto
 wordlist> ['La', ' ', 'felicità', ' ', 'è', ' ', 'tutto']
 word> La
 word>  
 word> felicità
 word>  
 word> è
 word>  
 word> tutto

需要注意的是,s是从另一个方法返回的字符串,所以我不能强制编码

s=u"La felicità è tutto"

关于Unicode和reg-ex的官方python文档,我没有找到令人满意的解释.

谢谢.

亚历山德罗

1> Andrew Hare..：

您正则表达式应该(\s) 不是(\W)这样的:

l = re.compile("(\s)").split(s)

上面的代码将为您提供所需的确切输出.但是以下行更有意义:

l = re.compile("\s").split(s)

它会拆分空白字符,并不会将所有空格作为匹配项.你可能需要它们,所以我发布了两个答案.

推荐阅读

程序员
忽略jshint不必要的分号错误

如何解决《忽略jshint不必要的分号错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Laravel中对孩子进行排序:我如何按名字对孩子进行排序？

如何解决《在Laravel中对孩子进行排序:我如何按名字对孩子进行排序？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在perl中指定单个空格分隔符

如何解决《在perl中指定单个空格分隔符》经验，为你挑选了1个好方法。 ... [详细]
程序员
更改Select2的默认字体

如何解决《更改Select2的默认字体》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Symfony 3目录结构使用Codeception

如何解决《如何使用Symfony3目录结构使用Codeception》经验，为你挑选了1个好方法。 ... [详细]
程序员
RSpec:#RSpec :: Core :: ExampleGroup :: Nested的未定义方法`allow'

如何解决《RSpec:#RSpec::Core::ExampleGroup::Nested的未定义方法`allow'》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在WinRT中清除TimeZoneInfo缓存？

如何解决《如何在WinRT中清除TimeZoneInfo缓存？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何查找列表的一部分是否在str中

如何解决《如何查找列表的一部分是否在str中》经验，为你挑选了1个好方法。 ... [详细]
程序员
单选按钮或复选框是否允许使用咏叹调？

如何解决《单选按钮或复选框是否允许使用咏叹调？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Elixir宏扩展问题,但只是在理解

如何解决《Elixir宏扩展问题,但只是在理解》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么indexedDB使用"版本"？

如何解决《为什么indexedDB使用"版本"？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Iala上的Scala隐式转换

如何解决《Iala上的Scala隐式转换》经验，为你挑选了1个好方法。 ... [详细]
程序员
CoordinatorLayout与RecyclerView和底部固定的EditText

如何解决《CoordinatorLayout与RecyclerView和底部固定的EditText》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用页面对象模式Selenium C#声明页面标题

如何解决《如何使用页面对象模式SeleniumC#声明页面标题》经验，为你挑选了1个好方法。 ... [详细]
程序员
有条件地应用!到JavaScript中的方法

如何解决《有条件地应用!到JavaScript中的方法》经验，为你挑选了2个好方法。 ... [详细]
程序员
将配置单元脚本的结果导出到没有日志记录信息的文件

如何解决《将配置单元脚本的结果导出到没有日志记录信息的文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
在通过索引访问元素时将char指针递增时是否有任何性能提升？

如何解决《在通过索引访问元素时将char指针递增时是否有任何性能提升？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在C中隐藏结构定义是一个好习惯吗？

如何解决《在C中隐藏结构定义是一个好习惯吗？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Android:将应用与自定义文件类型相关联

如何解决《Android:将应用与自定义文件类型相关联》经验，为你挑选了0个好方法。 ... [详细]
程序员
Container和DisplayObjectContainer有什么区别？

如何解决《Container和DisplayObjectContainer有什么区别？》经验，为你挑选了1个好方法。 ... [详细]

ar_wen2402851455

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章