时间序列分析中的序列相关性

用户头像数学算法大哥
2023-04-03 发布

时间序列分析中的序列相关性是时间序列分析中最重要的方面之一。时间序列分析是用来帮助我们制定交易策略的工具。当我们获得一个或多个金融时间序列时,我们主要关注预测或模拟数据。识别确定性趋势和季节变化,并将序列分解为这些成分是相对简单的。然而,这样的时间序列中还会留下一个随机分量,有时这些随机分量具有相关性。因此,作为定量建模者,我们需要尝试确定这些相关性的结构,以提高我们的预测和战略的潜在盈利能力,同时提高基于模型的任何模拟时间序列的真实性。这对于提高战略实施中风险管理组成部分的有效性非常有用。

当时间序列的序列观测以上述方式相互关联时,我们说时间序列中存在序列相关性(或自相关)。在这种情况下,我们需要用严格的数学方法来定义它。在此之前,我们需要建立在更简单的概念之上,包括期望和方差。

总之,了解序列相关性是时间序列分析的重要方面。在金融领域,随机成分的时间序列元素通常具有相关性,因此我们需要确定这些相关性的结构,以提高我们的预测和战略的潜在盈利能力,同时提高基于模型的任何模拟时间序列的真实性。

1. 期望、方差和协方差

1)期望Expectation

在统计学中,随机变量x的期望E(x)指其在总体中的平均值,通常用E(x)=u表示。
有了期望的定义,我们就能够定义方差,用于表征随机变量的“扩散”程度。

2)方差Variance

具体来说,方差是变量与平均值的平方偏差的期望值,用sigma平方表示。需要注意的是,方差始终是非负的。

3)标准差 Standard Deviation
标准差即方差的平方根,用σ表示。

4)协方差 Covariance
我们可以将方差和标准差的概念推广到两个随机变量之间的协方差概念。协方差告诉我们这两个变量的线性相关程度。令两个随机变量x和y各自的期望值为E(x)和E(y),则协方差为:

协方差的数值可以是正数、负数或零,分别表示正相关、负相关或无相关性。而且,协方差的值取决于两个变量的尺度。为了消除这种影响,我们可以使用相关系数,即两个变量的标准化协方差。

然而,由于我们处于统计状态,我们无法获取总体均值ux和uy。相反,我们必须从样本中估计协方差。因此,我们使用相应的样本均值和x bar 和 y bar。
如果我们考虑由n对随机变量(xi, yi)组成的样本,则样本协方差可由下式给出:

  1. 相关性 Correlation

    相关性是对两个变量如何共同变化的无量纲测量。本质上,它是两个随机变量的协方差,通过它们各自的标准差进行归一化。两个变量之间的(总体)相关性通常用p(x,y)表示,而分母的乘积将把相关性限制在区间[-1,1]内: p(x,y)=1的相关性表示精确的正线性关联; p(x,y)=0的相关性表示根本没有线性关联; p(x,y)=-1的相关性表示精确的负线性关联。

    与协方差类似,我们可以定义样本相关性Cor(x,y): 其中,Cov(x,y)是x和y的样本协方差,sd(x)是x的样本标准差。

  2. 时间序列中的平稳性

    在我们概述了预期、方差、标准差、协方差和相关性的一般定义后,我们就可以探讨如何将它们应用于时间序列数据。其中一个极为重要的概念是时间序列的平稳性,因为许多金融时间序列分析都与此有关。一旦我们讨论了平稳性,我们就能探讨序列相关性,并构建一些相关图。我们将从平均值/期望值开始尝试将上述定义应用于时间序列数据。

    1)平均值 时间序列的平均值为E(xt)=u(t)。

    2)均值平稳 如果u(t)=u,为一特定常数,则该时间序列为平稳的。

    3)时间序列的方差 4)方差中的平稳性 如果 为常数,则该时间序列为平稳的。

  3. 序列相关性 Serial Correlation

    序列相关性是指我们想要了解时间序列中的观测值如何相互影响。如果我们能找到这些观测值之间的结构,就可以提高预测和模拟的准确性。这将有助于改进交易策略的盈利能力或更好的风险管理方法。

1)二阶平稳性 时间序列的二阶平稳性是指它的均值、方差和自协方差都不随时间的推移而改变。具体来说,一个时间序列在二阶平稳的情况下,它的均值和方差是常数,而且它的自协方差只取决于时间点之间的间隔(即滞后)。如果一个时间序列是平稳的,但不是二阶平稳的,那么它可能仍然具有一些有用的性质,但在进行时间序列分析和建模时,二阶平稳性通常是一个重要的假设。

2)自协方差 如果时间序列模型具有二阶平稳性,则其关于滞后k的自协方差为: 自协方差不是关于时间t的函数,因为它包含期望值E(..),就像以前一样,是在可能的时间序列实现的总体集合中计算的。这意味着它在所有时间t上都是一样的。

3)时间序列的自相关 时间序列的自相关是指在一个时间序列中,不同时间点的观测值之间的相关性。它是通过计算序列的自协方差来衡量的,而自协方差则是在滞后k个时间点之后的观测值之间的协方差。如果在一个时间序列中,相隔k个时间点的观测值之间的相关性很强,那么这个时间序列就被认为是具有高自相关性的。自相关函数图可以帮助我们可视化时间序列的自相关性。

令一二阶平稳序列关于滞后k的自相关为pk,该值可以通过将滞后k的自协方差除以时间序列方差得到,即有

根据上述定义,我们可以定义样本自协方差函数和样本自相关函数。 样本自协方差函数表示时间序列样本值与它的滞后k期的样本值之间的相关性。它的计算公式如下: 其中,n表示时间序列的长度,xi表示第i个样本值,x bar表示时间序列的平均值。

样本自相关函数ck表示时间序列样本值与它的滞后k期的样本值之间的相关性,归一化到[-1,1]区间。它的计算公式如下:

其中,ck表示样本的自协方差函数,c0表示时间序列的方差,即滞后0期的自协方差。

  1. 总结

    在时间序列分析中,序列相关性是一个非常重要的概念。它描述了时间序列中相邻观测之间的关系,是许多金融时间序列分析的基础。 序列相关性可以通过自协方差和自相关函数来度量。自协方差函数和自相关函数描述了时间序列中不同滞后期之间的关系。如果时间序列是二阶平稳的,那么滞后期之间的相关性只与滞后期的距离有关。在计算序列相关性时,需要注意使用样本自协方差和样本自相关函数。 通过分析序列相关性,我们可以了解时间序列的趋势和周期性,从而更好地进行预测和建模。它还可以帮助我们开发交易策略和风险管理方法。

评论

用户头像
2023-04-22 09:16:01

嗯嗯,非常好,虽然有点看不懂

评论