我有一个pandas DF,它有许多包含这样的单词的字符串元素:
'Frost '
其前面有许多领先的白色空间.当我将这个字符串比较为:
'Frost'
我意识到由于领先的空间,比较是假的.
虽然我可以通过迭代pandas DF的每个元素来解决这个问题,但由于我拥有大量记录,因此进程很慢.
这种方法应该有效,但它不起作用:
rawlossDF['damage_description'] = rawlossDF['damage_description'].map(lambda x: x.strip(''))
所以当我检查一个元素时:
rawlossDF.iloc[0]['damage_description']
它返回:
'Frost '
这里发生了什么?
用这个替换你的功能:
rawlossDF['damage_description'] = rawlossDF['damage_description'].map(lambda x: x.strip())
你几乎把它弄好了,你需要摆脱''内部条带()
或者你可以使用str.strip
方法:
rawlossDF['damage_description'] = rawlossDF['damage_description'].str.strip()