当前位置:  开发笔记 > 编程语言 > 正文

Python正则表达式中的UTF

如何解决《Python正则表达式中的UTF》经验,为你挑选了1个好方法。

我知道Python 3修复了很多UTF问题,但我不能使用Python 3,我使用的是2.5.1

我正在尝试使用正则表达式文档,但文档中包含UTF连字符 - 而不是 - .Python无法与这些匹配,如果我将它们放在正则表达式中,它会抛出一个摇摆不定的东西.

我如何强制Python使用UTF字符串或以某种方式匹配像这样的字符?

谢谢你的帮助



1> Patrick McEl..:

你必须转义有问题的字符( - )并将au放在字符串文字的前面,使其成为一个unicode字符串.

所以,例如,这个:

re.compile("–") 

成为这个:

re.compile(u"\u2013")

推荐阅读
TXCWB_523
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有