我有两个数据列,其中包含列
df具有列:id1
id1 1 2 3 4 5 6
df2具有列:id2
id2 2 1 5 4
如您在df1中看到的,有些值不在df2 ['id2']中
3,6
有什么办法可以通过做两个数据框列的区别或其他方式找到它?
我尝试使用
df2.isin(df1)
但只会得到布尔值。
但我想要实际的行
有很多方法可以解决此问题,但是Pandas索引对象提供了一种difference
方法,该方法可以查找调用索引中第二个索引中缺少的所有索引。
idx1 = pd.Index(df.id1) idx2 = pd.Index(df.id2) idx1.difference(idx2).values array([3, 6])
与isin
您将得到相同的结果:
df[~df.id1.isin(df2.id2)]