当前位置:  开发笔记 > 编程语言 > 正文

如何从python中的unicode字符串中删除除数字和","之外的所有字符?

如何解决《如何从python中的unicode字符串中删除除数字和","之外的所有字符?》经验,为你挑选了1个好方法。

我正在用scrapy写小爬虫.其中一个XPath包含价格后跟"zł"(波兰货币标记)问题是它被新行字符,空格和非破坏空格混淆.所以当我这样做时:

sel.xpath("div/div/span/span/text()[normalize-space(.)]").extract()

我明白了:

[u'\n            1\xa0740,00 z\u0142\n            \n            \n                ']

我想改变的

[u'1740,00']

或者只是浮动变量.什么是/最好/最简单/最快的方法?



1> Eugene Yarma..:

您可以使用re.findall从字符串中提取字符:

>>> import re
>>> s = u'\n            1\xa0740,00 z\u0142\n            \n            \n            '
>>> L = re.findall(r'[\d,]', s)
>>> "".join(L)
'1740,00'

推荐阅读
个性2402852463
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有