这是在执行groupby之后直接应用过滤器.在您提供的数据中,pidx的值仅为20,因此会被过滤掉.
df.groupby('pidx').filter(lambda x: len(x) > 2) LeafID count pidx pidy 0 1 10 10 20 1 1 20 10 20 3 1 40 10 20 7 6 50 10 43