还剩5页未读,继续阅读
文本内容:
第三章课后练习答案
1.解:如果被解释变量(因变量)y与k个解释变量(自变量),,…,之间有线性相关关系,那么它们之间的多元线性总体回归模型可以表示为其中是k+1个未知参数,又称为回归系数;u是随机误差项
2.解:多元线性回归模型的基本有:1随机误差项的条件期望值为零即).2随机误差项的条件方差相同即().3随机误差项之间无序列相关即().4自变量与随机误差项独立即).5随机误差项服从正态分布即.6各解释变量之间不存在显著的线性相关关系即也就是说矩阵X的秩等于参数个数换句话说就是自变量之间不存在多重共线性.
3.解:的无偏估计量的计算公式为:
4.解:如果一个样本回归方程的样本决定系数为
0.98,我们不能判定这个样本回归方程就很理想.因为对于多元模型而言样本决定系数接近1只能说明模型的拟合度很高总体线性性显著但模型中每个解释变量是否是显著的无法判定所以还需要进行单个解释变量的显著性检验即t检验.5.解根据例
3.1数据,得到OLS的正规方程组求解得到==所以样本回归方程为
6.解
(1)利用OLS对数据进行回归得到回归方程如下
(2)由上述检验数据可以看出方程总体线性性显著,单单个解释变量并不显著
(3)因为方程拟合程度较高,总体线性性显著,所以模型可以用来进行预测当工业产量达到130000亿元,农业总产值达到25000亿元时,货运量能达到(万吨)
7.解案例的方差分解结果所缺数据如下ANOVAModel1SumofSquaresdfMeanSquareFSig.Regression
42555.
46176079.
3524.
785.002Residual
29221.
490231270.502Total
71776.
951308.解从该案例的分析数据来看,结果不满意因为但从模型的拟合优度(R2=
0.8528)和总体线性显著性(F=
11.5874,F-statistic=
0.0066)来看,结果还令人满意,但具体到每个解释变量的显著性时,可以看到x1(t=
0.5788,P=
0.5838)和x3(t=-
1.4236,P=
0.1978)甚至都无法通过α=15%的显著性检验,所以这两个解释变量显然不显著第四章课后练习答案
1.解古典线性回归模型的一个很重要的假定是随机项的同方差性,即对于每个,的方差都是同一个常数,当此假定不能满足时,则的方差在不同次的观测中不再是一个常数,而是取得不同的数值,即≠常数1,2,…,则称随机项具有异方差性(Heteroscedasticity)例如,考虑家庭的可支配收入和储蓄的关系,如建立如下模型其中,为第个家庭的储蓄,为第个家庭的收入从二者的关系不难看出,当收入增加时,储蓄平均也会随之增加如果我们对不同收入水平家庭的储蓄进行观察,同样也会发现,低收入的家庭储蓄差异性较小,而高收入的家庭储蓄的差异性较大这是因为低收入的家庭,其收入中扣除必要的生活支出以外,用于其他支出和储蓄的部分也较少,因此随机项波动的程度小,即方差小;而高收入家庭,其收入中扣除必要的生活支出以外,剩余的就较多,就有更大的使用选择余地,这样储蓄的差异就较大,因而随机项波动的程度就大,即方差大因此,对于家庭储蓄模型,随机项具有异方差性
2.解模型1无法使用OLS进行参数估计,因为随机误差项,即随机误差项与解释变量的平方之间有着显著地相关关系,这样会造成随机误差项的异方差现象,所以OLS不可以使用
3.解样本是否存在异方差(a)公司利润(b)婴儿死亡率(c)通货膨胀率(d)收入水平(e)差错率净财富人均收入货币增长率年龄上机时间《财富》前500强100个发达国家和发展中国家美国、加拿大和15个拉美国家1000名经济学家200名电脑初学者存在不存在不存在存在存在
4.解对某沿海地区家庭每年生活开支和每年收入进行抽样研究,调查了20个家庭,其中每五个家庭收入相同,共分作四组,数据列表如下组 家庭生 活开支(千元) 家庭收入(千元)
11.
82222.
15233.
23.
53.
53.
61034.
24.
24.
55.
851544.
855.
766.220家庭生活开支模型设定为式中表示家庭生活开支,表示家庭收入⑴利用求回归方程⑵做散点图,观察家庭生活开支离差量的变化情况由图形可以看出随着收入的增加,家庭生活开支的波动幅度逐渐增大⑶把数据分作两个子样本,第一子样本包括收入为5000元与10000元的家庭,即低收入家庭第二个子样本包括收入为15000元和20000元的家庭,即高收入的家庭进行检验⑷设,其中为一非零常数,变换原模型求回归方程
5.解在古典假设下,线性回归模型中参数的最小二乘估计量具有线性、无偏和有效性其中,有效性不仅依赖于古典假设中关于随机项的同方差假定,还依赖与随机项不存在序列自相关假定,即这表明随机项在不同观测点下取值不相关若这个假定违背,即在不同观测点下的取值相关联,则称存在序列相关或叫自相关(Autoregression)自相关产生的原因很多,主要有
(1)被解释变量的自相关,许多经济变量往往会有自相关,使用时间序列数据更是如此,其本期值往往受滞后值的影响
(2)模型省略了自相关的解释变量在建立回归模型时,总是要略去某些次要的解释变量如果略去的解释变量有一些存在自相关,它必然在随机项中反映出来,从而使随机项具有自相关性
(3)随机项本身存在自相关在许多情况下,随机因素(如干旱、暴风雨、战争、地震等)所产生的影响,常常持续好长时间
(4)回归模型的数学形式不正确若回归模型所采用的数学形式与所研究问题的真实关系不一致,随机项就可能存在自相关
(5)经济变量的惯性作用大多数的经济时间序列都有一个明显的特点,就是他们的惯性由于经济变量的惯性,使得许多经济变量前后期总是相互关联的自相关产生的后果,如果模型中的随机项存在自相关,仍然采用普通最小二乘法,会有以下后果
(1)最小二乘估计量仍然是线性的和无偏的,但不具有最小方差性,即不是最优的
(2)最小二乘估计量的方差估计是有偏的,用来估计随机项的方差和回归参数的方差公式会严重低估真实的方差和标准差,导致值偏大,使得某些参数显著不为零,即高估了部分参数的显著性
(3)因变量的预测精度降低
6.利用以下给定的统计量进行序列相关检验(=自变量数目,=样本容量)
(1)=
0.81,=3,=21,显著性水平=5%DL=
1.03DU=
1.67,因为=
0.81DL所以存在一阶正自相关
(2)=
3.48,=2,=15,显著性水平=5%DL=
0.95DU=
1.54,因为=
3.484-DL所以存在一阶负自相关
(3)=
1.56,=5,=30,显著性水平=5%DL=
1.07DU=
1.83,因为DL=
1.56DU所以无法判断
(4)=
2.64,=4,=35,显著性水平=5%DL=
1.22DU=
1.73,因为(4-DU)=
2.64(4-DL)所以无法判断
(5)=
1.75,=1,=45,显著性水平=5%DL=
1.48DU=
1.57,因为DU=
1.75(4-DU)所以不存在自相关
(6)=
0.91,=2,=28,显著性水平=5%DL=
1.26DU=
1.56,因为=
0.91DL所以存在一阶正自相关
(7)=
1.03,=5,=26,显著性水平=5%DL=
0.98DU=
1.88,因为DL=
1.03DU所以无法判断
7.解⑴用估计关于的回归方程为⑵用检验分析随机项的一阶自相关性因为DW=
1.662,DL=
1.20,DU=
1.41,DUDW(4-DU)所以不存在自相关⑶用两步法估计回归模型的参数;⑷直接用差分法估计回归模型参数
8.解古典线性回归模型的假定之一是,模型中包含的解释变量的观测值矩阵(包括常数项)其秩等于模型中解释变量的个数加1,即,此时就称解释变量1,2,…,之间不存在多重共线性但如果,说明观测值矩阵是降秩的,即矩阵的列向量存在某种线性相关关系,也就是解释变量之间存在某种线性相关,称为存在多重共线性(Multicollinearity)多重共线性存在的原因主要是经济活动经济变量之间复杂的相互联系另外在计量经济学的研究中,将某些解释变量的滞后值作为单独的新解释变量包含在模型中,已得到广泛的应用这样由于解释变量的前后期数值相关使得产生多重共线性后果多元线性回归模型中如果存在完全的多重共线性(CompleteMulticollinearity,或ExactMulticollinearity)则参数的最小二乘估计量是不确定的,其标准差为无穷大;如果存在接近的多重共线性(NearMulticollinearity),则参数的最小二乘估计量是确定的,而且具有无偏性,但其方差较大,常产生以下结果
(1)参数估计值不精确,也不稳定,样本观测值稍有变动,增加或减少解释变量等都会使参数估计值发生较大变化,甚至出现符号错误,从而不能正确反映解释变量对因变量的影响
(2)参数估计值的标准差较大,使参数的显著性检验增加了接受零假设的可能,从而舍去对因变量有显著影响的解释变量
(3)难以区分每个解释变量的单独影响计量经济研究中经常需要利用回归系数定量分析各个解释变量对因变量的单独影响程度而在多重共线性的情况下,解释变量的相关性将无法“保持其他变量不变”,从而也难以分离出每个解释变量的单独影响
9.解它们之间不存在多重共线性,这是因为虽然和是的函数,但它们之间并没有显著地线性相关关系
10.解
(1)将代入原模型得
(2)可以考虑将相对价格引入模型,建立如下模型
11.解
(1)利用SPSS对上述数据进行回归得到以下结果ModelSummarybModelRRSquareAdjustedRSquareStd.ErroroftheEstimate
1.990a.
980.
963.23611aPredictors:Constantx4x3x2x1bDependentVariable:yANOVAbModelSumofSquaresdfMeanSquareFSig.1Regression
13.
42243.
35660.
189.000aResidual.
2795.056Total
13.7019aPredictors:Constantx4x3x2x1bDependentVariable:yCoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstSig.CollinearityStatisticsBStd.ErrorBetaToleranceVIF1Constant
3.
9141.
9522.
005.101x
1.
060.
048.
4801.
246.
268.
02736.448x
2.
089.
037.
4072.
397.
062.
1417.074x3-.
013.018-.051-.
693.
519.
7381.356x
4.
007.
018.
123.
420.
692.
04820.948aDependentVariable:y由多重共线性的经典判断法可以看出该模型拟合优度及总体线性显著性都非常好,但单个解释变量显著性却都不理想,所以模型存在多重共线性此外从解释变量的方差扩大因子(VIF1=
36.448,VIF4=
20.948,二者均远大于10)也可以看出解释变量之间存在多重共线性
(2)利用SPSS中逐步回归分析法确定一个较好的回归模型如下ModelSummarycModelRRSquareAdjustedRSquareStd.ErroroftheEstimateDurbin-Watson
1.972a.
945.
938.
306602.988b.
975.
968.
219952.264aPredictors:Constantx1bPredictors:Constantx1x2cDependentVariable:yANOVAcModelSumofSquaresdfMeanSquareFSig.1Regression
12.
949112.
949137.
751.000aResidual.
7528.094Total
13.70192Regression
13.
36226.
681138.
106.000bResidual.
3397.048Total
13.7019aPredictors:Constantx1bPredictors:Constantx1x2cDependentVariable:yCoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstSig.CollinearityStatisticsBStd.ErrorBetaToleranceVIF1Constant.
942.
5731.
645.139x
1.
122.
010.
97211.
737.
0001.
0001.0002Constant
2.
323.
6263.
710.008x
1.
082.
016.
6515.
220.
001.
2274.411x
2.
080.
027.
3652.
923.
022.
2274.411aDependentVariable:y通过以上分析可以看出,选取x1,x2作为解释变量就可以很好的消除多重共线性,并且各类显著性检验都可以通过,所以我们得到以下回归方程
12.解工具变量法应用的基本思路是,当解释变量与随机项相关时,则寻找另一个变量,该变量与随机解释变量高度相关,但与随机项不相关,则称该变量为工具变量,用其替代随机解释变量工具变量的选择应满足以下条件工具变量必须具有实际经济意义;工具变量与随机解释变量高度相关,但与随机项不相关;工具变量与模型中的其他解释变量也不相关;模型中多个工具变量之间不相关
13.某经济学家想要估计税收入函数式中=政府税收=国内生产总值已知有测量误差,为了把注册的汽车数量作为一个工具变量,研究者决定采用工具变量法有关数据如下表年份19661967196819691970税收()(百万元)GDP(x)(十亿元)注册的汽车(z)(百万辆)345211576686454
(1)利用估计税收函数为
(2)用工具变量法估计税收函数=
0.
52381.3810所以得到回归方程为
(3)是的一个好的工具变量.。