当前位置:  开发笔记 > 编程语言 > 正文

剥离pandas数据帧列中的所有尾随空格

如何解决《剥离pandas数据帧列中的所有尾随空格》经验,为你挑选了2个好方法。

我有一个pandas DF,它有许多包含这样的单词的字符串元素:

'Frost                              '

其前面有许多领先的白色空间.当我将这个字符串比较为:

'Frost'

我意识到由于领先的空间,比较是假的.

虽然我可以通过迭代pandas DF的每个元素来解决这个问题,但由于我拥有大量记录,因此进程很慢.

这种方法应该有效,但它不起作用:

rawlossDF['damage_description'] = rawlossDF['damage_description'].map(lambda x: x.strip(''))

所以当我检查一个元素时:

rawlossDF.iloc[0]['damage_description']

它返回:

'Frost                              '

这里发生了什么?



1> Luis Miguel..:

用这个替换你的功能:

rawlossDF['damage_description'] = rawlossDF['damage_description'].map(lambda x: x.strip())

你几乎把它弄好了,你需要摆脱''内部条带()



2> Anton Protop..:

或者你可以使用str.strip方法:

rawlossDF['damage_description'] = rawlossDF['damage_description'].str.strip()


我在5M行数据集上尝试过此操作,与map + lambda相比,它需要两倍的时间
推荐阅读
和谐啄木鸟
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有