时间序列分析:白噪声模型与随机漫步模型

用户头像数学算法大哥
2023-04-03 发布

在本文中,我们将讨论第一个时间序列模型,包括一些基本的线性随机模型,并充分利用序列的相关性。特别是,我们将重点讨论白噪声和随机漫步。

在探讨定义之前,回顾一下我们研究这些模型的原因以及我们学习时间序列分析的最终目标。根本上,我们的目的是提高交易算法的盈利能力。我们不依赖“猜测”或“预感”,而是尽可能多地量化,既消除交易过程中的任何情绪参与,又确保我们的交易可重复性尽可能高。

为了提高我们的交易模型的盈利能力,我们必须利用统计技术来识别可用于盈利的资产的一致行为。为了发现这种行为,我们必须探索资产价格本身随时间的变化。时间序列分析有助于我们实现这一点。它为我们提供了一个强大的统计框架,用于评估时间序列的行为,例如资产价格,以帮助我们衡量这种行为。时间序列分析为我们评估资产价格行为提供了一个稳健的统计框架。
  1. 时间序列建模过程

    1)什么是时间序列模型?

    时间序列分析模型是一种数学模型,用于描述时间序列中的数据点之间的关系,并利用这些关系进行预测和分析。这些模型通常用于处理时间序列数据,例如股票价格、天气预报、经济指标、心电图、语音信号等等。 时间序列分析模型的目的是识别出数据中的模式和趋势,以便预测未来的趋势和变化。这些模型可以分为线性和非线性模型,其中线性模型通常使用统计方法,例如自回归模型(AR)、移动平均模型(MA)、自回归移动平均模型(ARMA)和自回归积分移动平均模型(ARIMA)等。 时间序列分析模型广泛应用于各种领域,例如金融、经济、气象、医学、信号处理等。它们被用于预测股票价格、通货膨胀率、人口增长率、心率、地震预测等等。 作为量化研究人员,我们的过程是考虑各种各样的模型,包括它们的假设和复杂性,然后选择一个“最简单”的模型来解释序列相关性。一旦我们有了这样一个模型,我们就可以用它来预测未来的价值或总体行为。这种预测在量化交易中显然非常有用。如果我们能够预测资产的运动方向,那么我们就有了交易策略的基础。此外,如果我们能够预测资产的波动性,那么我们就有了另一种交易策略或风险管理方法的基础。这就是为什么我们对二阶财产感兴趣,因为它们为我们提供了帮助进行预测的手段。

2)我们用什么标准来衡量模型?

我们用许多标准来衡量时间序列分析模型的好坏,其中最常用的是均方根误差(RMSE)和平均绝对误差(MAE)。

均方根误差是指预测值与实际值之间的差的平方的平均值的平方根。它度量预测值与实际值之间的平均偏差,因此较小的均方根误差表示更好的预测能力。

平均绝对误差是指预测值与实际值之间的差的绝对值的平均值。它度量预测值与实际值之间的平均绝对偏差,因此较小的平均绝对误差也表示更好的预测能力。

除了这些标准之外,还有其他许多衡量时间序列模型好坏的标准,如均方误差(MSE)、平均绝对百分比误差(MAPE)等,选择使用哪些标准通常取决于具体的应用场景和需求。

3)时间序列建模一般流程

我们的基本过程如下:首先,我们提出关于特定时间序列及其行为的假设。然后,获取时间序列的相关图(可能使用R或Python库)并评估其序列相关性。接下来,利用我们对时间序列模型的了解,拟合适当的模型以减少模型及其时间序列残差中的序列相关性(定义见下文)。然后,优化拟合,直到不存在相关性,并使用数学标准来评估模型拟合。接着,使用模型及其二阶财产对未来价值进行预测,并使用统计技术(如混淆矩阵、分类ROC曲线或MSE、MAPE等回归指标)评估这些预测的准确性。在这个过程中反复进行,直到准确度达到最佳,然后利用这些预测来制定交易策略。随着我们考虑在时间序列中考虑额外序列相关性的更高级模型,复杂性就会出现。

在本文中,我们将介绍两种最基本的时间序列模型:白噪声和随机游动。这些模型将成为以后更先进模型的基础,因此我们必须充分了解它们。然而,在我们介绍这两种模型之前,我们将讨论一些更抽象的概念,这些概念将帮助我们统一时间序列模型的方法,特别是定义后移算子和差分算子。
  1. 后移算子和差分算子

    后移算子(BSO)和差分算子(DFO)可以帮助我们以特定方式编写许多不同的时间序列模型,帮助我们理解它们之间的差异。

    后移算子是一种将时间序列元素作为自变量的操作符,并返回一个单位时间后的元素: 我们可以通过多次应用这个操作符来实现多次后移: 在未来的时间序列模型中,我们将使用后移算子来定义许多模型。

    此外,在研究非平稳时间序列模型时(即,均值和方差可以随时间变化的模型),我们可以使用差分算子来获取非平稳序列,并生成平稳序列。

    差分算子delta将时间序列元素作为参数,并返回该元素与前一个时间单位的元素之间的差异: 我们也可以通过多次应用该运算符来实现多次差分: 现在我们已经讨论了这些抽象的运算符,让我们考虑一些具体的时间序列模型。

  2. 白噪声 White Noise 白噪声时间序列模型是时间序列分析中最基本的模型之一。在这种模型中,时间序列的每个值都是从一个固定的平均值中抽取的独立随机变量,并且这些变量的方差是恒定的。 具体来说,设为时间序列的t时刻的值,那么白噪声时间序列模型可以写成: 其中,u是时间序列的常数平均值,ε(t)是一个随机误差项,它是一个独立同分布的随机变量序列,其均值为0,方差为sigma平方。 可以看出,白噪声时间序列的均值和方差都是固定的,因此它是一个平稳时间序列。这个模型的名字“白噪声”来自它的随机误差项的性质,它们在各个时间点上都是不相关的,就像白噪声一样。 在实际应用中,我们通常需要检验时间序列是否是白噪声,以确定我们是否可以使用白噪声模型来描述该时间序列。一般来说,我们可以使用自相关函数和偏自相关函数等方法来检验时间序列是否存在相关性。如果不存在相关性,那么该时间序列可以被视为白噪声。

1)离散白噪声 离散白噪声是一种简单的时间序列模型,它假设时间序列的每个值都是从具有相同分布的独立随机变量中随机生成的。这意味着,离散白噪声时间序列模型中的任何一个值都不会受到前面或后面时间步的值的影响。 离散白噪声时间序列模型可以用数学符号表示为: 其中,Xt表示在时间t观测到的时间序列值,ε(t)表示一个服从独立同分布(IID)的噪声过程,即: 其中,N(0,simga平方)表示均值为0、方差为sigma平方的正态分布。这意味着,离散白噪声时间序列模型中的每个时间步都是从相同的正态分布中独立抽取的,因此它们之间没有相关性。 在实际应用中,离散白噪声时间序列模型通常被用作其他更复杂的时间序列模型的基础,因为任何复杂的时间序列模型都必须能够在某种程度上比离散白噪声时间序列模型更好地描述时间序列数据中的相关性。

2)离散白噪声的一些属性

  1. 均值为0:离散白噪声的平均值为0,这意味着序列中所有的观测值都以相等的概率分布在均值的两侧。
  2. 方差为常数:离散白噪声的方差是常数,这意味着序列中所有观测值的方差都是相等的。
  3. 不存在序列相关性:离散白噪声的观测值之间不存在序列相关性。也就是说,序列中任意两个不同时刻的观测值之间的协方差为0,自相关系数也为0。
  4. 协方差函数是一个矩形函数:离散白噪声的协方差函数是一个矩形函数,也就是说,在k时刻之前和之后,协方差的绝对值都为0,只有在k时刻时为非零值。

    这些属性使得离散白噪声成为其他时间序列模型的基础,因为我们可以将任何时间序列分解为离散白噪声和其他具有特定性质的组成部分。这种分解使我们能够更好地理解时间序列的性质并进行预测和分析。

3)高斯白噪声

高斯白噪声是一种常见的白噪声模型,也是一种最常见的随机过程。在这个模型中,每个时间点上的观测值都是从一个高斯分布中独立地随机取样得到的。这种分布的特征是其均值为0且方差为常数。
在实际应用中,高斯白噪声通常被用作一种基准模型,用来检验其他时间序列模型的性能。如果其他模型的残差序列可以被证明是高斯白噪声,则认为该模型可以很好地描述数据,并且不需要进一步改进。如果残差序列不是高斯白噪声,则表明该模型还需要改进或调整。
在统计学中,高斯白噪声也是随机性的一种量化表达。由于其性质简单,且可以被用于任意的时间序列数据,因此它常被用来描述无规律变化的现象,如市场价格、气象数据、生物数据等。
  1. 随机漫步 Random Walk

1)定义 随机漫步是一种简单的时间序列模型,它假设未来值与当前值相同,并且随机偏离一个小量。这个小量被称为“步长”,并且可以是任何随机数或随机过程。随机漫步可以用数学公式表示为: Y(t) = Y(t-1) + ε(t) 其中,Y(t)是在时间t的值,Y(t-1)是在t-1时刻的值,ε(t)是表示随机波动的噪声项。由于ε(t)是随机的,因此Y(t)的值在时间上不断变化,没有任何明显的周期性或趋势。这使得随机漫步难以预测。 在金融领域,随机漫步被认为是一种股票价格的随机模型。这是因为股票价格在短期内可以随机波动,而长期上涨趋势可能由于公司盈利增长等基本因素产生。随机漫步可以用来模拟股票价格的短期波动,但不能预测长期趋势。 为了预测随机漫步,我们可以使用移动平均方法,这种方法将过去几个时间点的值平均起来来预测未来值。但是,这种方法只能用于短期预测,并且在模拟股票价格时并不总是准确的。

2)常见应用

  1. 股票市场预测:随机漫步模型被广泛用于股票市场预测中。它可以用来预测股价的未来走势。
  2. 经济预测:随机漫步模型也被用于经济预测。例如,它可以用来预测国内生产总值(GDP)的未来走势。
  3. 人口增长预测:随机漫步模型可以用来预测人口增长的未来走势。这对于政府和企业来说都是非常有用的。
  4. 环境科学:随机漫步模型可以用来预测气候变化、天气变化等。例如,它可以用来预测未来几年的降雨量或气温。
  5. 信号处理:随机漫步模型可以用来处理信号。例如,它可以用来处理音频信号或视频信号,以便进行压缩或噪声滤波。

  6. 总结

    时间序列分析是一种用于研究时间序列数据的方法,它在许多领域都有广泛的应用。在时间序列分析中,我们通常会使用一些模型来描述时间序列数据的行为和趋势,以便进行预测和决策。 在这些模型中,白噪声模型和随机漫步模型是两种最基本的模型。白噪声模型描述的是没有任何相关性的随机数据序列,而随机漫步模型描述的是随机变量随机游走的过程。 在实际应用中,我们通常会对时间序列数据进行分析和建模,并通过优化模型以达到最佳拟合来进行预测。同时,我们还需要使用各种统计技术来评估我们的预测准确性,并根据实际情况调整我们的模型和策略。 总之,时间序列分析是一项复杂的任务,需要深入的数学和统计学知识,以及实践经验和专业工具的支持,但它能够为我们提供非常有用的信息和预测结果,帮助我们做出更加明智的决策。

评论