当前位置:  开发笔记 > 编程语言 > 正文

用概率填写缺失值

如何解决《用概率填写缺失值》经验,为你挑选了1个好方法。



1> piRSquared..:

建立

fruit = pd.Series(['banana'] * 57 + ['apple'] * 54 + [None] * 10, name='fruit')

运用 pd.Series.sample

nullfruit = fruit.isnull()
fruit.loc[nullfruit] = fruit.dropna().sample(nullfruit.sum()).values

使用np.random.choicenp.unique

nullfruit = fruit.isnull().values
u, c = np.unique(fruit.values[~nullfruit], return_counts=1)

fruit.loc[nullfruit] = np.random.choice(u, nullfruit.sum(), p=c / c.sum())

推荐阅读
jerry613
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有