一、 实验题目:农业总产值的影响因素
1、 模型设定
我想要研究的是有关农业总产值的影响因素,通过查找相关资料和有关文献,最终选取了三个解释变量,分别是:水电设备容量、有效灌溉面积、主要农业机械总动力。
由初步的分析知,三个解释变量与被解释变量是正相关的。由此设定模型:
Y=
01X12X23X3i
其中:Y=农业总产值(亿元)
X1=水电设备容量(千瓦)
X2=有效灌溉面积(千公顷)
X3=主要农业机械总动力(万千瓦)。
解释变量的系数的预期为正。
数据来源于《中国统计年鉴2009》,选取了1990~2008年间的各项数据。
计量经济学实验
在试验中,我运用计量经济学的方法对上述模型所存在的问题进行研究。
2、Y与X1、X2、X3的散点图
①Y与X1的散点图
②Y与X2的散点图
③Y与X3的散点图
2
计量经济学实验
3、原始回归报告
ˆ= -76800.9252 + 0.0005299500849×X + 1.803170688×X - 0.3695497913×Y12
X3
(-1.719309) (1.657607) (1.658483) (-0.890416)
R2=0.926347 D-W=0.604840
R2=0.911616 SE=1894.745 F=62.88574
3
计量经济学实验
N=19
ei2n=1683.525 Y=14168.54 nh=0.1183
ei2n该模型回归估计的判决系数R2较高,方程较为显著,但是从Y考虑拟合程度,方程
的拟合程度并不高。三个解释变量的系数为正数,与预期一致,通过经济学意义检验。但三个解释变量参数的个别检验均通不过T-检验,三个解释变量参数的联合检验通过F-检验,说明三个变量对被解释变量的联合影响显著。因此可能存在多重共线性问题。而D-W值显示可能有自相关问题。
二、 针对该模型的各项试验
(一) 多重共线性
1、 检验
查找X1、X2、X3的相关系数得到相关数据:
可以看出三个解释变量之间存在严重的严格线性相关关系,通过计算VIF值得:vif=83.45可以判定该模型存在多重共线性问题,且情况严重。
2、 实验
4
计量经济学实验
进行岭回归估计实验,在实验过程中取试探性的选取λ=0,0.01……0.18,计算相应的i,i=1,2,……19,观察岭迹图。
1与λ的散点图
~①
②
2与λ的散点图
③
3与λ的散点图
5
计量经济学实验
经图形提醒,选择共同平缓的区段中的第十二个点,即:λ=0.12,进行计算,算出0=-28737.76。得到岭回归函数:
~Y =-28737.76+0.000167×X1+0.626987×X2+0.105469×X3
~ei2考虑拟合程度:n=1723.06 Y=14168.54 nh=0.1216
方程拟合有所下降,但是拟合损失较小,可以接受。
(二) 异方差问题
1、 检验
①图形法:
6
计量经济学实验
由此图,可知模型可能没有异方差问题。此外,该模型的(Xji,Yi)散点图并没有显著呈现喇叭形收缩或扩大。
②等级相关检验
由于本模型中,各个解释变量呈现随时间递增,因此计算统计量:
rsjn21rs2Tj=
j=-1.1837,进行T-检验,t2=1.753, T 差问题。 ③F检验 计算统计量:F= eeAB2i2i或F= eeBA2i2i 得F=1.138。F=2.43,F (三) 自相关问题 7 计量经济学实验 1、 检验 ①图示法 散点图:(t,et) (e(-1),e) 两个图形均提示模型可能存在正的自相关。 ②D-W检验 查D-W表得:dl=0.97,du=1.69,模型D-W=0.604840落于下界,因此存在正的自相关。 8 计量经济学实验 ③连贯检验 查连贯表得Na=5,由于LN=4, LN ①公式法 由于本模型数据N<30,所以采用小样本公式法。计算 dn2(1)(k1)222ˆ=n(k1)2=0.776308347826087,经过方程变换,得到(~)模型,做OLS 估计得到原模型的广义最小平方估计报告: ~~~XX1Y= 1030.984214+ 8.950618189e-006×- 0.1586093905×2+ 0.3977872885 ~X×3 (0.592769) (0.055525) (-1.989276) (2.875811) 9 计量经济学实验 R2=0.705821 R2=0.646985 SE=1205.331 D-W=0.917518 ei2n=665.4622 Y=4218.835 nh=0.157735850084868 由此报告可知,在处理自相关问题后,拟合程度下降,且下降幅度低于5%,拟合损失能接受,X2、X3的T-检验的显著性明显提高,而X1依然通不过T-检验,同时D-W=0.917518,此方法依然没有解决自相关问题。 ② 回归法 ˆ=ˆ=0.723356,经过方程变换,得到(~)模型,做OLS估计由etet1t,得到得到原模型的广义最小平方估计报告: ~~~XX2 + Y= -34405.84214 + 0.0001179937693×1+ 0.6993525311×~X0.1733839869×3 (-0.931243) (0.589885) (0.786401) (0.604974) 10 计量经济学实验 R2=0.767094 R2=0.720513 SE=1206.265 D-W=0.759727 ei2n=647.069 Y=4906.611 nh=0.131877333675679 由此报告可知,在处理自相关问题后,拟合程度下降,但下降幅度低于5%,拟合损失能接受,且与公式法相比,拟合程度有所提高,但X1、X2、X3依然通不过T-检验,同时D-W=0.759727,此方法依然没有解决自相关问题。 ③Durbin两步法 由 Yt0(1)YT11X1t1X1t1...kXktkXkt1UtUt1 ˆ=0.825003。经过方程变换,得到(~)模型,做OLS估计得到原模型的广,得到义最小平方估计报告: 11 计量经济学实验 ~~~XXY= 836.0112062 + 6.956644728e-006×1 + 0.1576603657×2 + ~X0.4046461212×3 (0.478840) (0.043946) (0.043946) (2.850007) R2=0.634415 R2=0.561298 SE=1199.098 D-W=0.952735 ei2n=550.8468 Y=3583.769 nh=0.153706406814719 由此报告可知,在处理自相关问题后,拟合程度下降,但下降幅度低于5%,拟合损失能接受, X3的T-检验的显著性明显提高,而X1、X2依然通不过T-检验,同时D-W=0.952735,仍然存在正的自相关,此方法依然没有解决自相关问题。 ④广义差分变换 ~~~XX1Y = -26779.90918 + 8.811743607e-005×+ 0.5226611444×2 + 0.2307414689× 12 计量经济学实验 (-0.520872) (0.432255) (0.435875) (0.684648) ~X3 + [AR(1)=0.8429665666] (3.918377) R2=0.967584 R2=0.957610 SE=1264.773 D-W=0.867393 ei2n=998.505 Y=14680.44 nh=0.13847 广义差分变换在拟合程度有所损失,但下降幅度低于5%,拟合损失能接受,但是X1、X2、X3依然没有通过T-检验,而且D-W值很低,仍然存在正的自相关,自相关问题没有得到解决。 分析:该模型的自相关问题并没有得到很好的解决,主要原因是模型在选择时不谨慎,以及自相关问题得不一定能解决性。 (四) 引入虚拟变量 1、 检验 由(Xji,Yi)散点图可以看出,本模型应采用三段定点引入虚拟变量。 0,1t110,1t71,11t1,7t定点介入虚拟变量:DT= Gt= 13 计量经济学实验 得到新的模型: Yb0b1xtb2xt1x*Dtb3xtxt2Gtt ,做OLS估计,得到回归报告: ˆ= -4905.137403 - 0.0009861163077×X + 0.001794521716×X - Y111 0.0006028128422×X12 (-0.172503) (-1.354105) (1.948332) (-1.280200) - 0.5005262513×X2 + 1.152463249×X21 + 1.14719824×X22 + 1.653380835×X3 – (-0.735277) (1.069376) (1.577283) (4.842408) 2.217585656×X31 + 0.6114074648×X32 14 计量经济学实验 (-3.792772) (2.061553) R2=0.998004 RF=500.1160 2=0.996009 SE=402.6338 D-W=2.602511 ei2n=317.689 Y=14168.54 nh=0.019558 小组式: ˆ=- 0.0009861163077×X- 0.5005262513×X+ 1.653380835×X t<7 Y123 ˆ=-6896.34872+0.000808405409×X+0.651936997×X-0.564204821×XY123 7≦t<11 ˆ=-85510.32702-0.001411218251×X+1.799135237×X+0.047102643×X Y123 11≦t ei2n在进行了虚拟变量试验后,回归估计的判决系数R2显著提高,从Y角度考虑的拟合 程度也显著提高,并且拟合程度很好,各项统计指标明显好转,D-W值显示方程没有自相关问题。但有解释变量通不过T-检验,在完成介入虚拟变量后依然存在多重公共线性问题。 15 因篇幅问题不能全部显示,请点此查看更多更全内容