如何使用numpy.correlate进行自相关？

作者：小色米虫_524 | 2023-08-29 13:55

如何解决《如何使用numpy.correlate进行自相关？》经验，为你挑选了6个好方法。

我需要对一组数字进行自相关,据我所知,它只是集合与自身的相关性.

我已经尝试使用numpy的相关函数,但我不相信结果,因为它几乎总是给出一个向量,其中第一个数字不是最大的,因为它应该是.

所以,这个问题实际上是两个问题:

究竟在numpy.correlate做什么？

我如何使用它(或其他东西)进行自动关联？

A. Levy.. 102

要回答您的第一个问题,请numpy.correlate(a, v, mode)执行a相反的卷积v并给出由指定模式剪切的结果.的卷积的定义,C(T)=Σ _{-∞一个_我 v _{吨+ I}其中-∞}

"full"模式返回t两者的结果a并且v有一些重叠.

"相同"模式返回与最短矢量(a或v)相同长度的结果.

"有效"模式返回结果,只有当a与v彼此完全重叠.该文件为numpy.convolve提供了有关模式的更多细节.

对于你的第二个问题,我认为numpy.correlate 是给你自相关,它只是给你一点点.自相关用于找出信号或函数在某个时间差处与自身的相似程度.在时间差为0时,自相关应该是最高的,因为信号与其自身相同,因此您期望自相关结果数组中的第一个元素将是最大的.但是,相关性不是从0的时间差开始.它从负时间差开始,接近0,然后变为正.也就是说,你期待:

自相关(A)=Σ _{-∞一个_我 v _{吨+ I}其中0 <= T <∞}

但你得到的是:

自相关(A)=Σ _{-∞一个_我 v _{吨+ I}其中-∞}
您需要做的是获取相关结果的后半部分,这应该是您正在寻找的自相关.一个简单的python函数就是:

def autocorr(x): result = numpy.correlate(x, x, mode='full') return result[result.size/2:]

当然,您需要进行错误检查以确保它x实际上是一维数组.此外,这种解释可能不是数学上最严格的.由于卷积的定义使用了无限性,我一直在无穷无尽,但这并不一定适用于自相关.因此,这种解释的理论部分可能略显不足,但希望实际结果是有帮助的.这些关于自相关的页面非常有用,如果您不介意使用符号和繁重的概念,可以为您提供更好的理论背景.

1> A. Levy..：
要回答您的第一个问题,请numpy.correlate(a, v, mode)执行a相反的卷积v并给出由指定模式剪切的结果.的卷积的定义,C(T)=Σ _{-∞一个_我 v _{吨+ I}其中-∞}

"full"模式返回t两者的结果a并且v有一些重叠.

"相同"模式返回与最短矢量(a或v)相同长度的结果.

"有效"模式返回结果,只有当a与v彼此完全重叠.该文件为numpy.convolve提供了有关模式的更多细节.

对于你的第二个问题,我认为numpy.correlate 是给你自相关,它只是给你一点点.自相关用于找出信号或函数在某个时间差处与自身的相似程度.在时间差为0时,自相关应该是最高的,因为信号与其自身相同,因此您期望自相关结果数组中的第一个元素将是最大的.但是,相关性不是从0的时间差开始.它从负时间差开始,接近0,然后变为正.也就是说,你期待:

自相关(A)=Σ _{-∞一个_我 v _{吨+ I}其中0 <= T <∞}

但你得到的是:

自相关(A)=Σ _{-∞一个_我 v _{吨+ I}其中-∞}
您需要做的是获取相关结果的后半部分,这应该是您正在寻找的自相关.一个简单的python函数就是:

def autocorr(x): result = numpy.correlate(x, x, mode='full') return result[result.size/2:]

当然,您需要进行错误检查以确保它x实际上是一维数组.此外,这种解释可能不是数学上最严格的.由于卷积的定义使用了无限性,我一直在无穷无尽,但这并不一定适用于自相关.因此,这种解释的理论部分可能略显不足,但希望实际结果是有帮助的.这些关于自相关的页面非常有用,如果您不介意使用符号和繁重的概念,可以为您提供更好的理论背景.

请注意,此答案给出了非标准化的自相关.
@DavidZwicker但结果却不同!`np.correlate(x,x,mode ='full')[len(x)// 2:]!= np.correlate(x,x,mode ='same')`.例如,`x = [1,2,3,1,2]; np.correlate(x,x,mode ='full');`{`>>> array([2,5,11,13,19,13,11,5,2])`}`np.correlate( x,x,mode ='same');`{`>>> array([11,13,19,13,11])`}.正确的是:`np.correlate(x,x,mode ='full')[len(x)-1:];`{`>>> array([19,13,11,5,2]) `}见**第一项**是**最大的一项**.
在numpy的当前版本中,可以指定"相同"模式以实现A.Levy提出的确切内容.然后函数体可以读取`return numpy.correlate(x,x,mode ='same')`
我认为@Developer提供了正确的切片方法：[[len（x）-1：]`从0延迟开始。由于全模式给出的结果大小为2 * len（x）-1，因此A.Levy的[[result.size / 2：]]与[[len（x）-1：]]相同。最好将其设置为int，例如`[result.size // 2：]`。

2> 小智..：
自相关有两个版本:统计和卷积.除了一些细节之外,它们都是相同的:统计版本被标准化为区间[-1,1].以下是如何进行统计分析的示例:

def acf(x, length=20): return numpy.array([1]+[numpy.corrcoef(x[:-i], x[i:])[0,1] \ for i in range(1, length)])

你想要``numpy.corrcoef [x:-i],x [i:])[0,1]``在第二行,因为``corrcoef``的返回值是2x2矩阵

3> Ramon J Rome..：
使用numpy.corrcoef函数代替numpy.correlate计算滞后t的统计相关性:

def autocorr(x, t=1): return numpy.corrcoef(numpy.array([x[:-t], x[t:]]))

4> maschu..：
由于我遇到了同样的问题,我想与您分享几行代码.事实上,目前有一些关于stackoverflow中自相关的相似帖子.如果将自相关定义为a(x, L) = sum(k=0,N-L-1)((xk-xbar)*(x(k+L)-xbar))/sum(k=0,N-1)((xk-xbar)**2)[这是IDL的a_correlate函数中给出的定义,并且它与我在问题#12269834的答案2中看到的内容一致],则以下似乎给出了正确的结果:

import numpy as np import matplotlib.pyplot as plt # generate some data x = np.arange(0.,6.12,0.01) y = np.sin(x) # y = np.random.uniform(size=300) yunbiased = y-np.mean(y) ynorm = np.sum(yunbiased**2) acor = np.correlate(yunbiased, yunbiased, "same")/ynorm # use only second half acor = acor[len(acor)/2:] plt.plot(acor) plt.show()

如你所见,我用sin曲线和均匀的随机分布测试了这个,两个结果看起来都像我期望的那样.请注意,我使用mode="same"而不是mode="full"像其他人那样.

5> Jason..：
我认为有两件事会增加这个话题的混乱:

统计与信号处理定义:正如其他人所指出的,在统计中我们将自相关归一化为[-1,1].

部分与非部分均值/方差:当时间序列在滞后> 0时移位时,它们的重叠大小将始终<原始长度.我们是使用原始(非部分)的均值和标准,还是总是使用不断变化的重叠(部分)来计算新均值和标准值.(这可能是一个正式的术语,但我现在要使用"部分").

我创建了5个函数来计算1d数组的自相关,部分与非部分区别.有些使用统计公式,有些使用信号处理意义上的相关,也可以通过FFT完成.但是所有结果都是统计定义中的自相关,因此它们说明了它们如何相互关联.代码如下:

import numpy import matplotlib.pyplot as plt def autocorr1(x,lags): '''numpy.corrcoef, partial''' corr=[1. if l==0 else numpy.corrcoef(x[l:],x[:-l])[0][1] for l in lags] return numpy.array(corr) def autocorr2(x,lags): '''manualy compute, non partial''' mean=numpy.mean(x) var=numpy.var(x) xp=x-mean corr=[1. if l==0 else numpy.sum(xp[l:]*xp[:-l])/len(x)/var for l in lags] return numpy.array(corr) def autocorr3(x,lags): '''fft, pad 0s, non partial''' n=len(x) # pad 0s to 2n-1 ext_size=2*n-1 # nearest power of 2 fsize=2**numpy.ceil(numpy.log2(ext_size)).astype('int') xp=x-numpy.mean(x) var=numpy.var(x) # do fft and ifft cf=numpy.fft.fft(xp,fsize) sf=cf.conjugate()*cf corr=numpy.fft.ifft(sf).real corr=corr/var/n return corr[:len(lags)] def autocorr4(x,lags): '''fft, don't pad 0s, non partial''' mean=x.mean() var=numpy.var(x) xp=x-mean cf=numpy.fft.fft(xp) sf=cf.conjugate()*cf corr=numpy.fft.ifft(sf).real/var/len(x) return corr[:len(lags)] def autocorr5(x,lags): '''numpy.correlate, non partial''' mean=x.mean() var=numpy.var(x) xp=x-mean corr=numpy.correlate(xp,xp,'full')[len(x)-1:]/var/len(x) return corr[:len(lags)] if __name__=='__main__': y=[28,28,26,19,16,24,26,24,24,29,29,27,31,26,38,23,13,14,28,19,19,\ 17,22,2,4,5,7,8,14,14,23] y=numpy.array(y).astype('float') lags=range(15) fig,ax=plt.subplots() for funcii, labelii in zip([autocorr1, autocorr2, autocorr3, autocorr4, autocorr5], ['np.corrcoef, partial', 'manual, non-partial', 'fft, pad 0s, non-partial', 'fft, no padding, non-partial', 'np.correlate, non-partial']): cii=funcii(y,lags) print(labelii) print(cii) ax.plot(lags,cii,label=labelii) ax.set_xlabel('lag') ax.set_ylabel('correlation coefficient') ax.legend() plt.show()

这是输出数字:

我们没有看到所有5条线,因为它们中的3条重叠(在紫色处).重叠都是非部分自相关.这是因为来自信号处理方法(np.correlateFFT)的计算不会为每个重叠计算不同的均值/标准.

另请注意,fft, no padding, non-partial(红线)结果不同,因为它在进行FFT之前没有用0填充时间序列,因此它是循环FFT.我无法详细解释为什么,这就是我从其他地方学到的东西.

6> 小智..：
您的问题1已在此处的几个优秀答案中进行了广泛讨论.

我想与您分享几行代码,这些代码允许您仅根据自相关的数学属性计算信号的自相关性.也就是说,可以通过以下方式计算自相关:

从信号中减去均值并获得无偏信号

计算无偏信号的傅里叶变换

通过取无偏信号的傅立叶变换的每个值的平方范数来计算信号的功率谱密度

计算功率谱密度的逆傅里叶变换

将功率谱密度的傅立叶逆变换归一化无偏信号的平方和,并仅取得结果矢量的一半

执行此操作的代码如下:

def autocorrelation (x) : """ Compute the autocorrelation of the signal, based on the properties of the power spectral density of the signal. """ xp = x-np.mean(x) f = np.fft.fft(xp) p = np.array([np.real(v)**2+np.imag(v)**2 for v in f]) pi = np.fft.ifft(p) return np.real(pi)[:x.size/2]/np.sum(xp**2)

推荐阅读

程序员
删除元素的函数(如果存在但添加元素)则不会

如何解决《删除元素的函数(如果存在但添加元素)则不会》经验，为你挑选了1个好方法。 ... [详细]

程序员
如何将字符串转换为Bash中的所有空格？

如何解决《如何将字符串转换为Bash中的所有空格？》经验，为你挑选了1个好方法。 ... [详细]

程序员
在一行和几行上写东西之间的区别

如何解决《在一行和几行上写东西之间的区别》经验，为你挑选了1个好方法。 ... [详细]

程序员
没有边框的python matplotlib表

如何解决《没有边框的pythonmatplotlib表》经验，为你挑选了1个好方法。 ... [详细]

程序员
我引入数据绑定后无法运行检测测试

如何解决《我引入数据绑定后无法运行检测测试》经验，为你挑选了0个好方法。 ... [详细]

程序员
VSTS/TFS构建/发布代理使用哪些端口？

如何解决《VSTS/TFS构建/发布代理使用哪些端口？》经验，为你挑选了1个好方法。 ... [详细]

程序员
为什么一个常数中有两个@符号？

如何解决《为什么一个常数中有两个@符号？》经验，为你挑选了1个好方法。 ... [详细]

程序员
将dict写入文件，每个键/值对在单独的行中

如何解决《将dict写入文件，每个键/值对在单独的行中》经验，为你挑选了1个好方法。 ... [详细]

程序员
真实用户监控:可靠性标准

如何解决《真实用户监控:可靠性标准》经验，为你挑选了1个好方法。 ... [详细]

程序员
奇怪的Java数学结果

如何解决《奇怪的Java数学结果》经验，为你挑选了1个好方法。 ... [详细]

程序员
如何获得用户的交换/ outlook/office365照片？

如何解决《如何获得用户的交换/outlook/office365照片？》经验，为你挑选了1个好方法。 ... [详细]

程序员
从Avro GenericRecord获取输入值

如何解决《从AvroGenericRecord获取输入值》经验，为你挑选了1个好方法。 ... [详细]

程序员
如何检查是否使用Protractor,CucumberJS和Chai检查复选框？

如何解决《如何检查是否使用Protractor,CucumberJS和Chai检查复选框？》经验，为你挑选了1个好方法。 ... [详细]

程序员
定义自定义负载平衡算法

如何解决《定义自定义负载平衡算法》经验，为你挑选了0个好方法。 ... [详细]

程序员
PHP7与Symfony3的兼容性？

如何解决《PHP7与Symfony3的兼容性？》经验，为你挑选了1个好方法。 ... [详细]

程序员
添加Reporting.WinForms参考VS2015

如何解决《添加Reporting.WinForms参考VS2015》经验，为你挑选了1个好方法。 ... [详细]

程序员
moment.js在现有日期设置时间并未正确设置时间

如何解决《moment.js在现有日期设置时间并未正确设置时间》经验，为你挑选了1个好方法。 ... [详细]

程序员
从ASP.net项目调用静态异步方法

如何解决《从ASP.net项目调用静态异步方法》经验，为你挑选了0个好方法。 ... [详细]

程序员
如何创建永远不会读取$ scope的$ scope函数？

如何解决《如何创建永远不会读取$scope的$scope函数？》经验，为你挑选了1个好方法。 ... [详细]

程序员
将IISExpress绑定到IP地址失败

如何解决《将IISExpress绑定到IP地址失败》经验，为你挑选了1个好方法。 ... [详细]

吐了个 "CAO" !

吐个槽吧,看都看了

会员登录 | 用户注册

小色米虫_524

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

actionscrip

bash

c#

c++

c语言

erlang

flutter

go

golang

java

javascript

lua

node.js

perl

php

python

scala

typescript

RankList | 热门文章

1D3:鼠标悬停时从序号轴获取最接近的值

2是否可以在没有VPC的情况下启动RDS实例？

3为什么onActivityResult总是返回0,即使按下确定按钮？

4CSS中边框底部的曲线末端

5如何从我的应用程序传递和检索内存流到DLL？

6Swift 2协议扩展使用

7如何将错误标记为不可重现？

8从命令行运行的Windows上的Python 3安装

9重定向到Firebase托管自定义域

10foo，bar，baz等的含义

11从文本文件中读取一行会返回不需要的斜杠

12如何从C++中的单独线程发布要在Android主线程上运行的代码？

13如何使用Firebase的新bolt编译器定义索引

14将某个JSON值映射到Enum值C#

15PMA 4.5.2.0 file_exists():open_basedir限制生效

16Nginx无法将Docker部署到亚马逊

17TLS变量上的"非常线程局部引用常规符号"错误

18使用BouncyCastle和GnuPG 2.1的`pubring.kbx`文件

19Null检查Linq中的String.ToLower表达式

20控制图例中的行数