11赞

如何在pandas数据帧中的列中计算非NaN值？

作者：N个小灰流_701 | 2023-09-08 12:53

如何解决《如何在pandas数据帧中的列中计算非NaN值？》经验，为你挑选了1个好方法。

我的数据如下:

            Close   a   b   c   d   e   Time    
2015-12-03  2051.25 5   4   3   1   1   05:00:00    
2015-12-04  2088.25 5   4   3   1   NaN 06:00:00
2015-12-07  2081.50 5   4   3   NaN NaN 07:00:00
2015-12-08  2058.25 5   4   NaN NaN NaN 08:00:00
2015-12-09  2042.25 5   NaN NaN NaN NaN 09:00:00

我需要"水平"计算不是NaN的列['a']到['e']中的值.结果将是这样的:

df['Count'] = .....
df

            Close   a   b   c   d   e   Time     Count
2015-12-03  2051.25 5   4   3   1   1   05:00:00 5  
2015-12-04  2088.25 5   4   3   1   NaN 06:00:00 4
2015-12-07  2081.50 5   4   3   NaN NaN 07:00:00 3
2015-12-08  2058.25 5   4   NaN NaN NaN 08:00:00 2
2015-12-09  2042.25 5   NaN NaN NaN NaN 09:00:00 1

谢谢

1> EdChum - Rei..：

您可以从您的df中进行选择并呼叫count传递axis=1:

In [24]:
df['count'] = df[list('abcde')].count(axis=1)
df

Out[24]:
              Close  a   b   c   d   e      Time  count
2015-12-03  2051.25  5   4   3   1   1  05:00:00      5
2015-12-04  2088.25  5   4   3   1 NaN  06:00:00      4
2015-12-07  2081.50  5   4   3 NaN NaN  07:00:00      3
2015-12-08  2058.25  5   4 NaN NaN NaN  08:00:00      2
2015-12-09  2042.25  5 NaN NaN NaN NaN  09:00:00      1

的时间设置

In [25]:
%timeit df[['a', 'b', 'c', 'd', 'e']].apply(lambda x: sum(x.notnull()), axis=1)
%timeit df.drop(['Close', 'Time'], axis=1).count(axis=1)
%timeit df[list('abcde')].count(axis=1)

100 loops, best of 3: 3.28 ms per loop
100 loops, best of 3: 2.76 ms per loop
100 loops, best of 3: 2.98 ms per loop

apply是最慢的,这不是一个惊喜,drop版本略快,但从语义上讲,我更喜欢传递感兴趣的列表并要求count可读性

嗯,我现在不断变化的时间:

In [27]:
%timeit df[['a', 'b', 'c', 'd', 'e']].apply(lambda x: sum(x.notnull()), axis=1)
%timeit df.drop(['Close', 'Time'], axis=1).count(axis=1)
%timeit df[list('abcde')].count(axis=1)
%timeit df[['a', 'b', 'c', 'd', 'e']].count(axis=1)

100 loops, best of 3: 3.33 ms per loop
100 loops, best of 3: 2.7 ms per loop
100 loops, best of 3: 2.7 ms per loop
100 loops, best of 3: 2.57 ms per loop

更多时间

In [160]:
%timeit df[['a', 'b', 'c', 'd', 'e']].apply(lambda x: sum(x.notnull()), axis=1)
%timeit df.drop(['Close', 'Time'], axis=1).count(axis=1)
%timeit df[list('abcde')].count(axis=1)
%timeit df[['a', 'b', 'c', 'd', 'e']].count(axis=1)
%timeit df[list('abcde')].notnull().sum(axis=1) 

1000 loops, best of 3: 1.4 ms per loop
1000 loops, best of 3: 1.14 ms per loop
1000 loops, best of 3: 1.11 ms per loop
1000 loops, best of 3: 1.11 ms per loop
1000 loops, best of 3: 1.05 ms per loop

似乎测试notnull和求和(因为notnull将生成布尔掩码)在此数据集上更快

在50k行df上,最后一种方法稍微快一些:

In [172]:
%timeit df[['a', 'b', 'c', 'd', 'e']].apply(lambda x: sum(x.notnull()), axis=1)
%timeit df.drop(['Close', 'Time'], axis=1).count(axis=1)
%timeit df[list('abcde')].count(axis=1)
%timeit df[['a', 'b', 'c', 'd', 'e']].count(axis=1)
%timeit df[list('abcde')].notnull().sum(axis=1) 

1 loops, best of 3: 5.83 s per loop
100 loops, best of 3: 6.15 ms per loop
100 loops, best of 3: 6.49 ms per loop
100 loops, best of 3: 6.04 ms per loop

推荐阅读

程序员
Laravel图像干预调整了质量损失

如何解决《Laravel图像干预调整了质量损失》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么我的内部联接不起作用

如何解决《为什么我的内部联接不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
PHP使用语言结构与魔术方法结合使用

如何解决《PHP使用语言结构与魔术方法结合使用》经验，为你挑选了0个好方法。 ... [详细]
程序员
如果有更改,如何中断eventListener？

如何解决《如果有更改,如何中断eventListener？》经验，为你挑选了0个好方法。 ... [详细]
程序员
没有使用strlen时strlen的分段错误？

如何解决《没有使用strlen时strlen的分段错误？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何用空格设置环境变量？

如何解决《如何用空格设置环境变量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
节点npm包抛出use strict:在发布和安装globaly后找不到命令

如何解决《节点npm包抛出usestrict:在发布和安装globaly后找不到命令》经验，为你挑选了1个好方法。 ... [详细]
程序员
DELETE_ON_CLOSE的用处

如何解决《DELETE_ON_CLOSE的用处》经验，为你挑选了0个好方法。 ... [详细]
程序员
用c ++或c语言打印fibo大数字

如何解决《用c++或c语言打印fibo大数字》经验，为你挑选了1个好方法。 ... [详细]
程序员
在最后一个斜杠后将值插入String

如何解决《在最后一个斜杠后将值插入String》经验，为你挑选了1个好方法。 ... [详细]
程序员
NodeJS检查SSL认证其他主机的有效性

如何解决《NodeJS检查SSL认证其他主机的有效性》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么我的活动空无一人？

如何解决《为什么我的活动空无一人？》经验，为你挑选了1个好方法。 ... [详细]
程序员
GoogleApiClient具有可选的Plus.API,并且未与Play服务8.3中引入的新Google标志连接到Plus

如何解决《GoogleApiClient具有可选的Plus.API,并且未与Play服务8.3中引入的新Google标志连接到Plus》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在laravel中保存使用条件？

如何解决《如何在laravel中保存使用条件？》经验，为你挑选了0个好方法。 ... [详细]
程序员
没有RTTI但仍然是虚拟方法

如何解决《没有RTTI但仍然是虚拟方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
当应用程序在设备上运行时,无法获取uiautomator工具中的元素

如何解决《当应用程序在设备上运行时,无法获取uiautomator工具中的元素》经验，为你挑选了1个好方法。 ... [详细]
程序员
动态添加脚本时未定义$/jQuery

如何解决《动态添加脚本时未定义$/jQuery》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在不打印的情况下在Matlab循环中监视变量？

如何解决《如何在不打印的情况下在Matlab循环中监视变量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将C#List <string>转换为Javascript

如何解决《将C#List<string>转换为Javascript》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在recyclelerView向下滚动时折叠后隐藏工具栏

如何解决《如何在recyclelerView向下滚动时折叠后隐藏工具栏》经验，为你挑选了0个好方法。 ... [详细]

N个小灰流_701

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章