我有点卡在这里。我有这段代码,可以取消文本内部的html元素并将其编码为utf8。
import HTMLParser def clean_text(text): htmlparser = HTMLParser.HTMLParser() return htmlparser.unescape( ' '.join(text.replace('\n', '').split()) ).replace(';', ',').encode('utf-8').strip()
而且我正在使用mysql(上帝救了我!)
并且此代码在两个项目中运行。在第一个项目中,代码运行良好,没有问题。在另一个项目中,字符串将像这样保存:
Die Verbindungen zwischen Dinosauriern und Vögeln immer stärker
它应该是
Die Verbindungen zwischen Dinosauriern und Vögeln immer stärker
我在两个项目django 1.7和python 2.7.9中都使用
我想念什么?mysql搭配是utf8_general_ci
,chatset是utf8
。两个mysql数据库的设置都相同。
解决这个问题将是一个奇迹...如果有人可以帮助我调试这个东西,我会热情的拥抱和亲吻