有没有一种快速的方法来自动生成每列的空百分比,并作为表输出?
例如,如果一列有40行,有10个空值,则为10/40
我使用以下代码但现在工作(没有显示值):
你可以用 df.count()
In [56]: df Out[56]: a b 0 1.0 NaN 1 2.0 1.0 2 NaN NaN 3 NaN NaN 4 5.0 NaN In [57]: 1 - df.count()/len(df.index) Out[57]: a 0.4 b 0.8 dtype: float64
时间,count
比得多快isnull.sum()
In [68]: df.shape Out[68]: (50000, 2) In [69]: %timeit 1 - df.count()/len(df.index) 1000 loops, best of 3: 542 µs per loop In [70]: %timeit df.isnull().sum()/df.shape[0] 100 loops, best of 3: 2.87 ms per loop