我有一个清单:
s = [0.995537725, 0.994532199, 0.996027983, 0.999891383, 1.004754272, 1.003870012, 0.999888944, 0.994438078, 0.992548715, 0.998344545, 1.004504764, 1.00883411]
我在Excel中计算了它的标准差,我得到了答案:0.005106477
我使用的函数是:=STDEV(C5:N5)
然后我使用numpy.std
as 进行相同的计算:
import numpy as np print np.std(s)
但是,我得到了答案: 0.0048890791894
我甚至写了自己的std函数:
def std(input_list): count = len(input_list) mean = float(sum(input_list)) / float(count) overall = 0.0 for i in input_list: overall = overall + (i - mean) * (i - mean) return math.sqrt(overall / count)
而我自己的函数给出与numpy相同的结果.
所以我想知道是否有这样的差异?或者只是我犯了一些错误?
有区别:Excel STDEV
计算样本标准差,而NumPy 默认std
计算人口标准差(它的行为类似于Excel STDEVP
).
要使NumPy的std
功能像Excel一样STDEV
,传入值ddof=1
:
>>> np.std(s, ddof=1) 0.0051064766704396617
这计算s
使用样本方差的标准偏差(即除以n-1
而不是n
.)