河源市是国务院1988年1月7日批准设立的地级市,为了深入研究河源市公路交通与经济发展的关系,本文选取了1988-2014年河源市建市以来24年的地区生产总值(GDP)和公路通车里程(GL)的时间序列数据。
其中公路通车里程(GL)用来反映河源市公路交通发展状况,地区生产总值(GDP)反映河源市的经济增长状况。
为了消取数据的异方差,将原始数据取对数,分别记做LogGDP和LogGL,数据见表,采用ADF法对LogGDP和LogGL的平稳性进行单位根检验。
可下载资源
VAR方法通过把系统中每一个内生变量,作为系统中所有内生变量的滞后值的函数来构造模型,从而回避了结构化模型的要求。VAR模型对于相互联系的时间序列变量系统是有效的预测模型,同时,向量自回归模型也被频繁地用于分析不同类型的随机误差项对系统变量的动态影响。如果变量之间不仅存在滞后影响,而不存在同期影响关系,则适合建立VAR模型,因为VAR模型实际上是把当期关系隐含到了随机扰动项之中。 1 平稳性与协整检验
单位根检验是序列的平稳性检验,如果不检验序列的平稳性直接OLS容易导致伪回归。
当检验的数据是平稳的(即不存在单位根),即意思是单位根检验的原假设是存在单位根,存在单位根,则不平稳,等价关系!要想进一步考察变量的因果联系,可以采用格兰杰因果检验。
平稳性检验有3个作用:1)检验平稳性,若平稳,做格兰杰检验,非平稳,作协正检验。2)协整检验中要用到每个序列的单整阶数。
当检验的数据是非平稳(即存在单位根),并且各个序列是同阶单整(协整检验的前提),想进一步确定变量之间是否存在协整关系,可以进行协整检验,协整检验主要有EG两步法和JJ检验 (1)、EG两步法是基于回归残差的检验,可以通过建立OLS模型检验其残差平稳性 (2)、JJ检验是基于回归系数的检验。
在eviews中,ADF检验的方法:1 view—unit roottest,出现对话框,默认的选项为变量的原阶序列检验平稳性,确认后,若ADF检验的P值小于0.5,拒绝原假设,说明序列是平稳的,若P值大于0.5,接受原假设,说明序列是非平稳的;2 重复刚才的步骤,view—unit root test,出现对话框,选择1stdifference,即对变量的一阶差分序列做平稳性检验,和第一步中的检验标准相同,若P值小于0.5,说明是一阶平稳,若P值大于0.5,则继续进行二阶差分序列的平稳性检验。
虽然定义经过d阶差分后是平稳的,但是软件只提供到2阶差分,若是原始数据没有经过差分就平稳,则说明那是零阶单整,记为I(0)的过程。
首先,对1988-2014年河源市24年的LogGDP和LogGL时间序列进行ADF单位根检验,单位根检验结果如表:
t值和p值是等效的,p值要求小于给定的显著水平,越小越好,小于0.05.等于0是最好的。结果显示,LogGDP和LogGL的ADF值分别为-3.160130和-1.895105,均大于水平值,说明接受原假设,LogGDP和LogGL序列存在单位根,为非平稳序列。因此,需要对LogGDP和LogGL序列继续第二步检验,即对LogGDP和LogGL的一阶差分进行检验,结果如表 :
结果显示,LogGDP和LogGL经过一阶差分检验,得到一阶差分序列D(LogGDP)和D(LogGL)的p值分别为0.0046和 0.0000,均小于0.05的显著值。由于D(LogGDP)和D(LogGL)都是单整序列,且单整阶数相同,均为I(1),所以LogGDP和LogGL两序列之间可能存在协整关系。
GDP与公路交通里程GL协整性检验
由序列的平稳性检验结果可知,河源市地区生产总值GDP和公里通车里程GL在1988-2014年这个时间序列中可能存在协整关系,协整检验的方法有Engle Granger两步法和Johansen极大似然法前者适合对两变量的模型进行协整检验后者适合在多变量的VAR模型中进行检验。
利用engle和granger提出的两步检验法:
首先建立OLS回归模型,结果为
首先建立模型:y=ax+c+e,结果为loggdp= 2.332247*loggl + -7.210750
由ADF单位根检验结果可以看出上述变量是一阶平稳的符合granger因果关系检验的条件.现对各变量之间进行granger因果关系检验以确定它们之间的相互影响关系.取滞后阶数为2阶。
随时关注您喜欢的主题
granger因果检验:
从结果可知拒绝loggl不能granger loggdp的假设,即loggl granger引起loggdp;但是不能拒绝loggdp不能granger引起loggl,即接受loggdp不能granger引起loggl。
同时,对方程的残差进行ADF检验结果可以看出残差序列不是平稳的,因此loggdp和loggl之间不存在协整关系。
建立VAR模型
利用Eviews计量经济分析软件,本文对logGDP、loggl变量建立VAR(1)模型,对于VAR模型滞后阶数的选择,得到如表所列的5个评价指标,且5个指标均认为1阶合理即建立VAR(1)模型。
同时,有两类回归统计量出现在VAR对象估计输出的底部:
输出的第一部分的标准OLS回归统计量。根据各自的残差分别计算每个方程的结果,并显示在对应的列中。
输出的第二部分是VAR模型的回归统计量。
即协整方程式是:
LOGGDP=1.36534925116*LOGGDP(-1)-0.326349983643*LOGGDP(-2)+0.139864325278*LOGGL(-1)-0.239810823184*LOGGL(-2)+0.44758535991
可以看到VAR模型的所有根模的倒数都小于1,即都在单位圆内,则该模型是稳定的。可以对VAR模型进行一个标准差的脉冲响应函数分析。
脉冲响应函数是用来衡量随机扰动项的一个标准差冲击对其他变量当前与未来取值的影响轨迹它能够比较直观地刻画变量之间的动态交互作用。
本文继续利用方差分解技术分析经济增长速度、交通量增长之间的相互贡献率。进行方差分解示意图。
各变量对经济增长速度的贡献率。
实证检验
为了检验所建立交通量VAR预测模型的效果,用EVIEWS软件对loggdp历史数据仿真,得到如下预测模型。
loggdp = @coef(1) * loggdp(-1) + @coef(2) * loggdp(-2) + @coef(3) * loggl(-1) + @coef(4) * loggl(-2) + @coef(5)
@coef(1) = 1.3653493
@coef(2) = -0.3263500
@coef(3) = 0.1398643
@coef(4) = -0.2398108
@coef(5) = 0.4475854
用VAR方法建立的GDP预测模型预测精度较高,效果较好。此外,可以得到如下的比较图:
同时,对loggl历史数据仿真,得到如下预测模型。
loggl = @coef(1) * loggdp(-1) + @coef(2) * loggdp(-2) + @coef(3) * loggl(-1) + @coef(4) * loggl(-2) + @coef(5)
@coef(1) = 0.9502916
@coef(2) = -0.8089714
@coef(3) = 0.5952874
@coef(4) = -0.0153147
@coef(5) = 1.7812591
以及历年loggl预测值、loggl实际值。
采用VAR方法建立的GDP预测模型有一个显著优点,即它不用对当期的GDP或其他变量作出预测,只用历史的GDP和交通量数据,就可以对GDP做出比较准确的预测,由于减少中间变量预测的传递,相应提高了模型预测精度。
可下载资源
关于作者
Kaizong Ye是拓端研究室(TRL)的研究员。在此对他对本文所作的贡献表示诚挚感谢,他在上海财经大学完成了统计学专业的硕士学位,专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。
本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。
非常感谢您阅读本文,如需帮助请联系我们!