最近在学习ARIMA模型,在这里记录一下自己的学习笔记,以便后续复习巩固。
在t期的值,受其前p期历史值的影响。例如,在销售预测中,2022年业绩,可能会受到2021年和2020年业绩的影响。也就是给定2021年和2020年业绩,就可以预测2022年业绩,此时p=2。
3.1.1 平稳序列的性质
序列的均值(平均值)为一个固定的常数 μ
序列滞后 l 阶的协方差为 ,该协方差只与滞后阶数 l 有关,而与t无关。换而言之,不同滞后阶数有不同的协方差;
序列的方差为一个固定的常数
3.1.2 平稳序列的判断方法
画出时间序列的折线图,如果折线图围绕某一个水平直线上下波动,既没有上升的趋势也没有下降的趋势,那么就可以判断该序列为弱平稳的时间序列(如下图);
(2)ADF单位根检验法
运用python进行ADF检验,当P值小于0.01或0.05时,就可以认为序列是弱平稳的。
3.2.1 白噪声序列的特点
在任何两个时点的随机变量都不相关,序列中没有任何可以利用的动态规律,因此不能用历史数据对未来进行预测和推断。
3.2.2 白噪声序列的判断方法
采用LB统计量的方法进行白噪声检验,当P值小于0.01或0.05时,既可认为序列是非白噪音序列。
通过软件画出数据的偏自相关图表,如偏自相关出现p阶截尾,则可以判断AR模型的滞后阶数为p。
如下图,左边为自相关图表,右边为偏自相关图表。从右边的图表来看,在4阶之后,下降幅度较大,初步判断p值为4。
先对数据进行1阶回归,再进行2阶回归,最后进行p阶回归,每回归一次便会产生一个AIC值,选取AIC值最小的那个模型。
直接使用Python中的ARMA模型库,进行模型拟合。需要观察每一个滞后阶数的统计量的P值是否通过。如下图的拟合结果,滞后5阶和6阶,在0.05的水平下,都是不通过的,因此模型的最优滞后阶数为4阶。
统计检验的P值越小,说明参数估计越可靠,一般小于0.01或0.05就认为是可靠估计。
残差就是真实值减去模型拟合值。如果模型拟合较好,那残差就会是一个白噪音序列,即所有的可预测的因素都已在模型中体现。
残差检验的方法和3.2.2 白噪声序列的判断方法是相同的。
残差的平方和:表示的是不能用模型解释的波动;
样本的平方和:表示的是样本的总体波动;
除去模型未解释的部分,那剩下的就是模型可以解释的部分,即
文章转载自宏蜘蛛,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
假设系数为0,t比较大则拒绝假设,认为系数不为0.
假设系数为0,P比较小则拒绝假设,认为系数不为0.
假设方程不显著,F比较大则拒绝假设,认为方程显著。
2.小样本运用OLS进行估计的前提条件为:
(1)线性假定。即解释变量与被解释变量之间为线性关系。这一前提可以通过将非线性转换为线性方程来解决。
(2)严格外生性。即随机扰动项独立于所有解释变量:与解释变量之间所有时候都是正交关系,随机扰动项期望为0。(工具变量法解决)
(3)不存在严格的多重共线性。一般在现实数据中不会出现,但是设置过多的虚拟变量时,可能会出现这种现象。Stata可以自动剔除。
(4)扰动项为球型扰动项,即随即扰动项同方差,无自相关性。
3.大样本估计时,一般要求数据在30个以上就可以称为大样本了。大样本的前提是
(2)渐进独立的平稳过程
(3)前定解释变量,即解释变量与同期的扰动项正交。
(4)E(XiXit)为非退化矩阵。
(5)gt为鞅差分序列,且其协方差矩阵为非退化矩阵。
与小样本相比,其不需要严格的外生性和正太随机扰动项的要求。
稳健标准差回归:reg y x1 x2 x3, robust 回归系数与OLS一样,但标准差存在差异。如果认为存在异方差,则使用稳健标准差。使用稳健标准差可以对大样本进行检验。
只要样本容量足够大,在模型出现异方差的情况下,使用稳健标准差时参数估计、假设检验等均可正常进行,即可以很大程度上消除异方差带来的副作用
5.如果回归模型为非线性,不方便使用OLS,则可以采取最大似然估计法(MLE),或者非线性最小二乘法(NLS)
6.违背经典假设,即存在异方差的情况。截面数据通常会出现异方差。
(1)看残差图,但只是直观,可能并不准确。
扰动项的方差随观测值而变动,表示可能存在异方差。
P比较小,则拒绝同方差假设,表示存在异方差,不能用OLS。反之则证明为同方差。(3)BP检验
【摘要】:目的探讨季节性时间序列ARIMA预测模型在时间序列资料分析中的应用,建立门诊量的预测模型。方法采用最小二乘法估计模型参数,通过对数转换及差分方法使原始序列平稳,按照残差不相关原则、简洁原则确定模型结构,依据AIC和SBC准则确定模型阶数,建立ARIMA预测模型。结果季节自回归参数有统计学意义。方差估计值为0.001956,AIC=-443.26,SBC=-437.51。对模型进行白噪声残差分析,拟合优度统计量表中表明ARIMA的估计具体模型为:(1-B)(1-B12)Zt=(1-0.24269B)(1-0.30096B12)at是适合的。结论用所建立模型对月门诊量进行预测,结果表明ARIMA是一种短期预测精度较高的预测模型。
|
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。