时间序列
法原理及步骤
----目标变量随决策变量随时间序列变化系统
一、认识时间序列变动特征
认识时间序列所具有的变动特征,以便在系统预测时选择采用不同的方法
1》随机性:均匀分布、无规则分布,可能符合某统计分布(用因变量的散点图和直方图及其包含的正态分布检验随机性,
大多服从正态分布)
2》平稳性:样本序列的自相关函数在某一固定水平线附近摆动,即方差和数学期望稳定为常数
识别序列特征可利用函数ACF:其中是的k阶自
协方差,且
平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋于0,前者测度当前序列与先前序列之间简单和常规的相关程度,后者是在控制其它先前序列的影响后,测度当前序列与某一先前序列之间的相关程度。实际上,预测模型大都难以满足这些条件,现实的经济、金融、商业等序列都是非稳定的,但通过数据处理可以变换为平稳的。
二、选择模型形式和参数检验
1》自回归AR(p)模型
模型意义仅通过时间序列变量的自身历史观测值来反映有关因素对预测目标的影响和作用,不受模型变量互相独立的假设条件约束,所构成的模型可以消除普通回归预测方法中由于自变量选择、多重共线性的比你更造成的困难用PACF函数判别(从p阶开始的所有偏自相关系数均为0)
2》移动平均MA(q)模型
识别条件
平稳时间序列的偏相关系数和自相关系数均不截尾,但较快收敛到0,
则该时间序列可能是ARMA(p,q)模型。实际问题中,多数要用此模型。因此建模解模的主要工作时求解p,q和φ、θ的值,检验和的值。
模型阶数
实际应用中p,q一般不超过2.
3》自回归综合移动平均ARIMA(p,d,q)模型
模型含义
模型形式类似ARMA(p,q)模型,但数据必须经过特殊处理。特别当线性时间序列非平稳时,不能直接利用ARMA(p,q)模型,但可以利用有限阶差分使非平稳时间序列平稳化,实际应用中d(差分次数)一般不超过2.
模型识别
平稳时间序列的偏相关系数和自相关系数均不截尾,且缓慢衰减收敛,则该时间序列可能是ARIMA(p,d,q)模型。若时间序列存在周期性波动,则可按时间周期进行差分,目的是将随机误差有长久影响的时间序列变成仅有暂时影响的时间序列。即差分处理后新序列符合ARMA(p,q)模型,元序列符合ARIMA(p,d,q)模型。
一个平稳的随机过程有以下
:均数不随时间变化,方差不随时间变化,自相关系数只与时间间隔有关,而与所处的时间无关。
偏自相关函数(PACF)解决如下问题:
高阶的自相关是否真的非常重要?
是他的确有意义,还是因为低阶自相关系数较大才引起高阶自相关系数也大?
如果建立一个以前值预测现在值的回归模型,需要包括多少个以前值?
指数平滑法用序列过去值的加权均数来预测将来的值,并且给序列中近期的数据以较大的权重,远期的数据给以较小的权重。理由是随着时间流逝,过去值的影响逐渐减小。指数平滑法应用时存在以下问题:kφkr
指数平滑法只适合于影响时间的消逝呈指数下降的数据、指数平滑法的每次预测都是根据上一个数来的,一般来说,用序列的第一个数作为初始值。
如果数据点较多,那么经过指数衰减后,初始值的影响就不明显了。但是如果数据点少,则初始值的影响会很大,甚至大于近期的数据点,这就违背指数平滑影响呈指数衰减的假设了。所以,如果数据点少时应该考虑初始值的问题,一般来说,数据点大于40初始值的影响就不太明显。需要指出的是,时间序列模型的预测一般不能太超前,对过于遥远的时间预测结果大多是不准确的。
三、利用模型进行趋势预测
四、评估预测结果并修正模型
宋方雷
2013-2-4于北华大学