共15页
计量作业
4.3下表给出了中国商品进口额Y、国内生产总值GDP、居民消费价格指数CPI。表
4.11中国商品进口额、国内生产总值、居民消费价格指数年份商品进口额(亿元)国内生产总值(亿元)居民消费价格指数(1985=100)198512
5.7890
1.60100.XXX
9.83102
7.5210
6.519871
6.1421
5.861
1.431988
5.51150
4.281
3.581XXXX8921
8.99169
9.23160.XXX
7.43186
6.781
6.521XXXX9133
9.87217
8.15170.819924
4.43326
9.2351
8.XXX
9.862353
3.39
8.419XXXX9960.1481
9.792
5.861XXXX5110
4.81607
9.3730
2.819XXXX6115
5.74711
7.6
6.327XXXX1180
6.578
9.7303
3.711XXXX9811
6.XXX
2.33
3.441XXXX9913
7.364896
7.71
3.297XXXX0001
8.63889
9.214
6.331XXXX1201
4.9210
9.65523
3.332XXXX2244
30.31
3.3273
30.620XXXX3341
9.56135
8.2283
3.XXX
6.435815
9.87833
4.772XXXX5542
7.371830
8.483
5.392XXXX6633
7.69211
9.2353
4.922XXXX7732
8.4624
9.52993
7.65资料中国统计年鉴,中国统计出版社____年、____年。请考虑下列模型:1)利用表中数据估计此模型的参数。2)你认为数据中有多重共线性吗?
3)进行以下回归:根据这些回归你能对数据中多重共线性的性质说些什么?
4)假设数据有多重共线性,但在5%水平上个别地显著,并且总的F检验也是显著的。对这样的情形,我们是否应考虑共线性的问题?
解答:
(1)建立模型参数估计结果如下:模型估计结果为
(2)居民消费价格指数的回归系数的符号不能进行合理的经济意义解释,且且CPI与进口之间的简单相关系数呈现正向变动,所以我认为数据中可能存在多重共线性。二者相关系数为表明GDP与CPI之间存在较高的线性相关。
(3)建立模型其参数估计结果如下模型估计结果为建立模型其参数估计结果如下模型结果为建立模型其参数估计结果如下模型结果为单方程拟合效果都很好,回归系数显著,可决系数较高,GDP和CPI对进口分别有显著的单一影响,在这两个变量同时引入模型时影响方向发生了改变,这只有通过相关系数的分析才能发现。
(4)如果仅仅是作预测,可以不在意这种多重共线性,但如果是进行结构分析,还是应该引起注意。
4.7在本章开始的“引子”提出的“农业的发展反而会减少财政收入吗?
”的例子中,如果所采用的数据如下表所示表
4.131978-____年财政收入及其影响因素数据年份财政收入(亿元)CS农业增加值(亿元)NZ工业增加值(亿元)GZ建筑业增加值(亿元)JZZ总人口(万人)TPOP最终消费(亿元)CUM受灾面积(千公顷)SZM197811
3.2310
2.XXX
3.829XXXX9223
9.150XXXX7911
4.641270.21
7.5971
4.389XXXX5422
6.337XXXX198011
4.9913
7.1619
9.651
9.559XXXX5300
7.944XXXX8111
7.581
5.495
4.84
7.110XXXX7233
6.153XXXX9821
2.12317
7.7421
6.232
20.7101XXXXXXXXXXX3671
9.78423
7.56270.610XXXX0841
2.643XXXX9841
6.4292
3.161278
9.316XXXX3574
8.XXXXXXX5200
4.825
6.4434
4.8
7.417XXXX8515
9.863XXXX1986212227
8.87396
7.525XXXX5076
8.2184XXXX8721
8.9432
3.3045
8.5
8.665XXXX00780
4.642XXXX8823
5.723
8.65457
7.728101XXXX6983
9.550XXXX9892
6.64942
6.596XXXX4112704111
6.424XXXX9902
9.37150
6.20685
8.XXXXXXX2090.538XXXX9131
3.94853
4.2280
8.7110
1.511XXXX3140
9.195XXXX9234
8.3375
8.666102
8.45141XXXX7117
3.351XXXX9343
4.8956
9.638XXXX8822
6.651XXXX7218
8.994XXXX1994
5.218195
7.XXX.72
9.647XXXX0292
4.225XXXX99562
4.22121
3.XXX.63
7.288XXXX2136
7.482XXXX1996740
7.99140
1.54294
4.7643
8.741XXXX8943
9.195XXXX1997
8.XXX
4.41932
9.2144
6.2161XXXX8140.653XXXX1998
9.XXX
8.176340
1.844
9.858XXXX1515
8.825XXXX999114
4.408XXXX4770.035
8.61551
7.211XXXX8655
6.369XXXX2000133
9.52314
9.447400
3.6.552XXXX3126XXXX165XXXX001163
8.604157
8.XXX.65
9.317XXXX2766
8.783XXXX20021890
3.641
6.53704
7.431364
6.551XXXX3716
9.124XXXX0321
7.XXX
8.1754
9.XXX.XXX
7.743XXXX062004263
9.64721
4.127XXXX1086
9.431XXXX8870
3.293XXXX00531
6.XXX
20.076
9.129101
3.381XXXX5696
9.181XXXX006XXXX8760.XXX.0913
10.911
8.5111XXXX1105
9.534XXXX00751
3.XXX
9.501073
6.72140
1.4113XXXX1284
4.XXX(资料中国统计年鉴2008,中国统计出版社____年版)试分析:为什么会出现本章开始时所得到的异常结果?
怎样解决所出现的问题?
答:根据样本数据得到各解释变量的样本相关系数矩阵如下:解释变量之间相关系数较高,特别是农业增加值、工业增加值、建筑业增加值、最终消费之间,相关系数都在0.9以上。这显然与
第三章对模型的无多重共线性假定不符合。解决方案:采用逐步回归的方式,可以得到没有共线性的回归模型,但可能存在设定偏误。第一步,分别作CS对NZ、GZ、JZZ、TPOP、CUM、SZM的一元回归,CS对NZ的回归参数估计如下:依次用EVIEWS可以如上推出CS对GZ、JZZ、TPOP、CUM、SZM的一元回归。整理可得一元回归结果变量NZGZJZZTPOPCUMSZM参数估计值
1.XXX.42681
7.318685
10.XXX.XXX.111530t统计量
1.2403
9.XXX
8.226773
3.620602
5.181XXXX8950.XXX.XXX.XXX.XXX.57904
10.XXX.00365
10.XXX.XXX.XXX.XXX.918690-0.031932第二步,加入XX的最大,以XX为基础,顺次加入其他变量逐步回归。依次类推整理可得加入新变量的回归结果
(一)变量NZXXJZZTPOPCUMSZMXX,NZ-
1.XXX.XXX.993152(-
10.50486)
2.500056)XX,JZZ
1.65227-
9.XXX.990547
1.146367)(-
8.514941)XX,TPOP0.514796-0.XXX.98301
2.629703)(-
5.325453)GZ,CUM0.910503-0.XXX.985025
1.118199)(-
5.984236)GZ,SZM0.430639-0.XXX.970053
30.62427)(-
2.099504)经比较,新加入NZ的方程=0.993152,改进最大,但是得系数为负,这显然不符题意。在的基础上分别加入其他变量后发现,的系数都为负,与预期估计违背。因此这些变量都会引起严重的多重共线性,全部剔除,只保留。修正的回归结果为:=-10
7.5289+0.426817t=(-
1.884708)
2.890168)=0.967567=0.966408F=
8.353074这说明在其他因素不变的情况下,工业增加值每增加1亿元,财政收入平均增加0.426817亿元。可决系数为0.967567,较高,说明模型拟合优度高;F值为
8.353074,说明整个方程显著;斜率系数的t值
2.890168,大于t统计量,t检验显著,符合题意。逐步回归后的结果虽然实现了减轻多重共线性的目的,但反映农业增加值,建筑业增加值的NZ,JZZ等也一并从模型中剔除出去了,可能会带来设定偏误,这是在使用逐步回归时需要注意的问题。
举报
