我目前正在关注关于熊猫的Wes McKinneys教程,我想知道是否有可能在其中做某件事.我将用一个例子解释一下:我有一个数据框:
A B C 0 1 foo data1 1 5 foo2 data2 2 8 foo3 data3 3 6 foo data4 4 5 foo3 data5 5 3 foo2 data1
我想将以前的数据帧转换为一个新的数据框,如下所示:
data1 data2 data3 data4 data5 foo 1 0 0 6 0 foo2 3 5 0 0 0 foo3 0 0 8 0 5
另外,我不能两次使用相同的foo-data组合,所以我不关心覆盖值.
大熊猫有可能吗?
您可以为原始数据框df
设置索引,列和值的正确值.
a = df.pivot_table(index='B',columns='C',values='A').fillna(0)
该fillna(0)
替换NaN
用0
的值.
C data1 data2 data3 data4 data5 B foo 1 0 0 6 0 foo2 3 5 0 0 0 foo3 0 0 8 0 5