我知道Python 3修复了很多UTF问题,但我不能使用Python 3,我使用的是2.5.1
我正在尝试使用正则表达式文档,但文档中包含UTF连字符 - 而不是 - .Python无法与这些匹配,如果我将它们放在正则表达式中,它会抛出一个摇摆不定的东西.
我如何强制Python使用UTF字符串或以某种方式匹配像这样的字符?
谢谢你的帮助
你必须转义有问题的字符( - )并将au放在字符串文字的前面,使其成为一个unicode字符串.
所以,例如,这个:
re.compile("–")
成为这个:
re.compile(u"\u2013")