当前位置:  开发笔记 > 编程语言 > 正文

Pandas:drop_duplicates()基于python中的条件

如何解决《Pandas:drop_duplicates()基于python中的条件》经验,为你挑选了1个好方法。
如何解决《Pandas:drop_duplicates()基于python中的条件》经验,为你挑选了1个好方法。



1> ranlot..:

您可以'C'基于'A'和创建第三列,'B'并使用它来查找重复项:

df['C'] = df['A'] + df['B']
df['C'] = df['C'].apply(lambda x: ''.join(sorted(x)))
df = df.drop_duplicates(subset='C')[['A', 'B']]

推荐阅读
牛尾巴2010
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有