在执行pandas.DataFrame.groupby()。sum()时,可以保留非数字列(第一个出现的值)吗?
例如,我有一个这样的DataFrame:
df = pd.DataFrame({'A' : ['aa1', 'aa2', 'aa1', 'aa2'],'B' : ['bb1', 'bbb1', 'bb2', 'bbb2'],'C' : ['cc1', 'ccc2', 'ccc3', 'ccc4'],'D' : [1, 2, 3, 4],'E' : [1, 2, 3, 4]}) >>> df A B C D E 0 aa1 bb1 cc1 1 1 1 aa2 bbb1 ccc2 2 2 2 aa1 bb2 ccc3 3 3 3 aa2 bbb2 ccc4 4 4 >>> df.groupby(["A"]).sum() D E A aa1 4 4 aa2 6 6
以下是我想要获得的结果:
B C D E A aa1 bb1 cc1 4 4 aa2 bbb1 ccc2 6 6
请注意,列B
和C
的值是每个组键的第一个关联的B值和C值。