完成以下问题:(至少保留三位小数)
(1).写出需求量对消费者平均收入、商品价格的线性回归估计方程。 (2).解释偏回归系数的统计含义和经济含义。 (3).对该模型做经济意义检验。 (4).估计调整的可决系数。
(5).在95%的置信度下对方程整体显著性进行检验。 (6).在95%的置信度下检验偏回归系数(斜率)的显著性。
2??e?et?1(7).检验随机误差项的一阶自相关性。(?t?300d?1.36)
,dL?1.08,U12.设某地区机电行业销售额Y(万元)和汽车产量X1(万辆)以及建筑业产值X2(千万元)。经Eviews软件对1981年——1997年的数据分别建立线性模型和双对数模型进行最小二乘估计,结果如下:
表1
Dependent Variable: Y
Variable C X1 X2 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 表2
Dependent Variable: Ln (Y)
Variable Coefficient Std. Error C Ln(X1) Ln(X2) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 1.写出电行业销售额对汽车产量和建筑业产值的双对数线性回归估计方程。 2.对双对数模型进行经济意义检验和统计意义检验。 3.比较表1和表2,你将选择哪个模型?为什么?
4.如果有两种可供选择的措施以提高机电行业销售额,措施a提高汽车产量,措施b增大建筑业产值,你认为哪个措施效果更明显?为什么?
t-Statistic Prob. 0.0000 0.0138 0.0000 6.243029 0.356017 -1.660563 -1.513526 99.81632 0.000000 Coefficient Std. Error t-Statistic Prob. 0.4899 0.0113 0.0000 545.5059 193.3659 11.31701 11.46405 65.83991 0.000000 -57.45496 81.02202 -0.709128 45.70558 15.66885 2.916971 11.93339 1.516553 7.868761 0.903899 Mean dependent var 0.890170 S.D. dependent var 64.08261 Akaike info criterion 57492.12 Schwarz criterion -93.19457 F-statistic 2.103984 Prob(F-statistic) 3.734902 0.212765 17.55410 0.387929 0.137842 2.814299 0.568470 0.055677 10.21006 0.934467 Mean dependent var 0.925105 S.D. dependent var 0.097431 Akaike info criterion 0.132899 Schwarz criterion 17.11479 F-statistic 1.839701 Prob(F-statistic)
第四章 异 方 差
一、单项选择题
1.若回归模型中的随机误差项存在异方差性,则估计模型参数应采用( ) A.普通最小二乘法 B.加权最小二乘法 C.广义差分法 D.工具变量法
2. 如果回归模型中的随机误差项存在异方差,则模型参数的普通最小二乘估计量( ) A.无偏且有效 B.无偏但非有效 C.有偏但有效 D.有偏且非有效 3. 戈德菲尔德-匡特检验法可用于检验( )
A.异方差性 B.多重共线性 C.序列相关 D.设定误差 4. 容易产生异方差的数据为( )
A.时序数据 B.修匀数据 C.横截面数据 D..年度数据 5. 假设回归模型为
将模型变换为( )
,其中
则使用加权最小二乘法估计模型时,应
A. B.
C. D.
6. 异方差是指( )
A.V(μi)= σ2 =常数 B. V(μi)= σi2≠常数 C. cov(μi, μj)= σi2 D.cov(μi, μj)= 0 7. 指出不存在异方差性的图示( )
222f(X)?XVar(u)??Xiiii8. 若双变量模型中,,或,则加权最小二乘法的权是:( )
1f(x) D. f(x))
A.1/f(x) B. f(x) C.
9. 异方差性是违背以下哪条假设( )
2
A. E(μi)=0 B. V(μi)= ζ C. 所有自变量线性无关。 D. cov(μi, Xj)= 0 10.如果戈德菲尔德——匡特检验显著,则认为什么问题是严重的( ) A.异方差问题 B.序列相关问题 C.多重共线性问题 D.设定误差问题 二、多项选择题
1. 不满足线性模型的第2条假定,即不满足随机扰动项的方差是一个常数的假定,发生这种模型设定错误称为异方差。异方差对最小二乘法估计造成的后果( )
A.是普通最小二乘估计仍然是无偏的,但参数的显著性检验失效 C.是预测的精确度降低
E.提醒我们,在处理截面数据时无须加以注意 2. Goldfeld-Quant检验的具体步骤( )
A.将n对样本观察值(Xi,Yi),按解释变量的大小顺序排序
B.将序列中间的C= n / 4个观察值除去,并将剩下的观察值划分为大小相同的两个子样。每个子样的容量为(n-c)/2 个
C.对每个子样分别求回归方程,并计算出各自的D.提出假设:H0:ζ12 =ζ22 HA: ζ12≠ζ22 3. 异方差性的检验方法有( ) A.图示法 B.WLS C.帕克检验法
B.是普通最小二乘法估计不再具有最小方差特性 残差平方和
D.造成参数估计式不再是无偏的 E.由各个子样的ESS构造F统计量;
D.格莱泽检验法 E.GLS 4. 异方差性的解决方法有( ) A.图示法 B.WLS
C.对原模型进行变换法 D.格莱泽检验法 E.GLS 三、填空题
5.当模型存在异方差现象时,加权最小二乘估计量具有( )
A.线性 B.无偏性 C.有效性 D.一致性 E.精确性
1.项古典假定中的第三条-随机扰动项的 的假定被破坏,而其它5项古典假定均满足,则称出现了 。
2. 通常若出现违反6项基本假定时,将数据先取对数再进行最小二乘法估计,因为对数据进行对数变换可以减少 和 的程度。
3. 在计量经济学研究中除了采用大量的统计检验方法外,还采用了一些计量经济学特有的检验方法。计量经济学检验有两类基本方法: 和 。图示法是利用 ,以供分析检验使用。 四、判断题
1. 在存在异方差情况下,普通最小二乘法(OLS)估计量是有偏的和无效的。 2. 如果存在异方差,通常用的t检验和F检验是无效的。
3. 在存在异方差情况下,常用的OLS法总是高估了估计量的标准差。
4. 如果从OLS回归中估计的残差呈现系统模式,则意味着数据中存在着异方差。 五、问答题
1. 说明加权最小二乘法的基本思想
2. 简述异方差对模型参数的普通最小二乘估计的影响。 3. 什么是异方差?使用哪些方法可以消除 4. 已知消费模型:其中:
yt??0??1x1t??2x2t?ut
yt——消费支出
x1t——个人可支配收入
x2t——消费者的流动资产 E(ut)?0
22Var(ut)??2x1t(其中?为常数)
要求:
(1)进行适当变换消除异方差,并证明之;
(2)写出消除异方差后,模型的参数估计量的表达式。
5. 试举例说明经济现象中的异方差性, 检验异方差性的方法思路是什么? 6. 异方差的含义是什么?它对下面各项有何影响? (a)OLS估计量及其方差? (b)置信区间?
(c)显著性t检验和F检验的使用?
7. 在如下回归中,你是否预期存在着异方差?
Y X (a)公司利润
(b)公司利润的对数 (c)道琼斯工业平均指数 (d)婴儿死亡率 (e)通货膨胀率
净财富
净财富的对数 时间 人均收入 货币增长率
样本 《财富》500强 《财富》500强
1960~1990年(年平均)
100个发达国家和发展中国家 美国、加拿大和15个拉美国家
8. 从直观上解释,当存在异方差时,加权最小二乘法(WLS)优于OLS法? 9. 简要解释下列异方差诊断方法的逻辑关系: (a)图形法 (b)Park检验 (c)Glejser检验
10. 在双变量总体回归函数中,假设误差方差有如下结构: E(ui2)??2Xi4
你如何变换模型从而达到同方差的目的?你将如何估计变换后的模型?列出估计步骤。
六、计算分析题
1. 根据我国1985--2001年城镇居民人均可支配收入和人均消费性支出资料,按照凯恩斯绝对收入假说建立的消费函数计量经济模型为:
城镇居民人均消费性支出?137.422?0.772?城镇居民人均可支配收入(5.875)(127.09)R2?0.9992tS.E?51.9DW?1.205F?16151e??451.9?0.871?城镇居民人均可支配收入(-0.283)(2.103)R2?0.477SE?3540DW?1.91F?4.424(1) 解释模型中137.422和0.772的意义; (2) 简述什么是模型的异方差性; (3) 检验该模型是否存在异方差性;
2. 考虑如下两个回归方程(根据1946-1975年美国数据)(括号中给出的是标准差):
Ct?26.19?0.6248GNPt?0.4398Dt
se=(2.73) (0.0060) (0.0736)
R=0.999
2
????1D?C??25.92?0.6246?0.4315 ??GNPtGNPt?GNP???t se= (2.22) (0.0068) (0.0597)
2
R= 0.875
其中,C——总私人消费支出 GNP——国民生产总值 D——国防支出 T——时间
Hanushek和Jackson研究的目的是确定国防支出对经济中其他支出的影响。 (a)将第一个方程变换成第二个方程的原因是什么?
(b)如果变换的目的是为了消除或者减弱异方差,那么对误差项要作哪些假设? (c)如果存在异方差,是否已成功地消除异方差?你是如何知道的? (d)变换过回归方程是否一定要通过原点?为什么? (e)能否将两个回归方程中的R2加以比较?为什么?
3.在研究人口密度对离中心商业区距离的回归函数中,Maddala根据1970年巴尔的摩地区39个人口普查区的有关数据得到如下回归结果:
?lnYi?10.093?0.239Xi
t= (54.7) (-12.28)
R=0.803
2
???lnYi??Xi??1??9.932?0.2258Xi ?Xi?? t= (47.87) (一15.10)
其中,Y——普查区的人口密度
X——离中心商业区的距离(英里)
(a)如果存在异方差,作者在其数据中作了哪些假设?
(b)从变换后的(WLS)回归函数中,你如何知道异方差已被消除或减弱了? (c)你如何解释回归结果?它是否有经济意义?
4.参考下表给出的R&D数据。回归方程(11—30)给出了对数形式的R&D和销售的回归结果。
1988年美国研究与发展(R&D)支出费用
序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
行业 容器与包装 非银行金融机构 服务行业 金属与采掘业 住房与建筑业 一般制造业 闲暇时间行业 纸与林产品行业 食品行业 健康护理业 宇航业 消费品 电器与电子产品 化学工业 聚合物 办公设备与计算
机 燃料 汽车行业
销售额 6 375.3 11 626.4 14 655.1 21 896.2 26 408.3 32 405.6 35 107.7 40 295.4 70 761.6 80 552.8 95 294.0 101 314.1 116 141.3 122 315.7 141 649.9 175 025.8 230 614.5 293 543.0
R&D费用支出 62.5 92.9 178.3 258.4 494.7 l 083.0 1 620,6 421.7 509.2 6 620.1 3 918.6 1 595.3 6 107.5 4 454.1 3 163.8 13 210,7 1 703.8 9 528.2
(单位:百万美元) 利润 1 851.1 1 569.5 274.8 2 828.1 225.9 3 751.9 2 884.1 4 645.7 5 036.4 13 869.9 4 487.8 10 278.9 8 787.3 16 438.8 9 761.4 19 774.5 22 626.6 18 415.4
注:行业是按销售额递增的次序排列的。
资料来源:Business Week,Special l989 Bonus lssue,R&DScorecard,pp.180—224。 (a)根据表提供的数据,验证这个回归结果。
(b)分别将残差的绝对值和残差平方值对销售量描图。是否表明存在着异方差? (c)对回归的残差进行Park检验和Glejser检验。你得出什么结论? (d)如果在双对数模型中发现了异方差,你会选择用哪种WLS变换来消除它?
(e)如果对线性回归函数下面,有证据表明存在着异方差。而在对数—对数模型中没有证据表明存在异方
差,那么,你将选择哪个模型,为什么?
R&D?192.99?0.0319销售额
se=(990.99) (0.0083)
t=(0.1948) (3.8434) r=0.478 3
(f)能够比较两个回归方程的R吗?为什么?
2
2
计量经济学 拓展训练
主编:刘永萍 李翠锦 唐 勇 支小军
经管学院计量经济学教研组
2014年3月
第一章 概 念
一、单项选择题
1.将内生变量的前期值作解释变量,这样的变量称为( )
A.虚拟变量 B.控制变量 C.政策变量 D.滞后变量 2.随机方程又称为( ) A.定义方程 B..政策方程 C.行为方程 D.制度方程
3.( )是具有一定概率分布的随机变量,它的数值由模型本身决定。 A.外生变量 B.内生变量 C.前定变量 D.滞后变量
4.同一统计指标按时间顺序记录的数据列称为() A.横截面数据 B.时间序列数据 C.修匀数据 D.原始数据
5.从宏观角度考察国民经济的运行,一般是将市场分为最终产品市场、生产要素市场和( ) A.原材料市场 B.农产品市场 C.金融市场 D.劳务市场
6.下列选项中,哪一项是统计检验基础上的再检验(亦称二级检验)准则( ) A.经济计量准则 B.经济理论准则
C.统计准则 D.统计准则和经济理论准则 7.单方程经济计量模型必然是( ) A.行为方程 B.政策方程 C.制度方程 D.定义方程 8.经济计量分析的工作程序( ) A.设定模型,检验模型,估计模型,改进模型 B.设定模型,估计参数,检验模型,应用模型 C.估计模型,应用模型,检验模型,改进模型 D.搜集资料,设定模型,估计参数,应用模型 9.用模型描述现实经济系统的原则是( ) A.以理论分析作先导,解释变量应包括所有解释变量
B.以理论分析作先导,模型规模大小要适度 C.模型规模越大越好;这样更切合实际情况 D.模型规模大小要适度,结构尽可能复杂
10.下面说法正确的是( ) A.内生变量是非随机变量 B.前定变量是随机变量 C.外生变量是随机变量 D.外生变量是非随机变量
11.发达市场经济国家宏观经济计量模型的核心部分包括总需求,总供给和( ) A.建模时所依据的经济理论 B.总收入
C.关于总需求、生产和收入的恒等关系 D.总投资
12.关于经济计量模型进行预测出现误差的原因,正确的说法是( ) A.只有随机因素 B.只有系统因素
C.既有随机因素,又有系统因素 D.A、B、C都不对
13.线性模型的影响因素( ) A.只能是数量因素 B.只能是质量因素
C.可以是数量因素,也可以是质量因素 D.只能是随机因素
14.经济计量模型是指( ) A.投入产出模型 B.数学规划模型
C.包含随机方程的经济数学模型 D.模糊数学模型
15.在具体的模型中,被认为是具有一定概率分布的随机数量是 ( ) A.内生变量 B.外生变量 C.虚拟变量 D.前定变量
16.下列宏观经济计量模型中投资函数所在方程的类型为 ( )
A.技术方程式 B.制度方程式 C.恒等式 D.行为方程式 17.结构式模型中的每一个方程都称为结构式方程,在结构方程中,解释变量可以是前定变量,也可以是 ( )
A.外生变量 B.滞后变量
C.内生变量 D.外生变量和内生变量 18.前定变量是( )的合称。 A.外生变量和滞后变量 B.内生变量和外生变量 C.外生变量和虚拟变量 D.解释变量和被解释变量
19.计量经济学是一门( )学科。 A.数学 B.经济 C.统计 D.测量 20.狭义计量经济模型是指( )。 A.投入产出模型 B.数学规划模型
C.包含随机方程的经济数学模型
D.模糊数学模型
21.计量经济模型分为单方程模型和( )。 A.随机方程模型 B.行为方程模型 C.联立方程模型 D.非随机方程模型 22.样本数据的质量问题,可以概括为完整性、准确性、可比性和( )。
A.时效性 B.一致性 C.广泛性 D.系统性 23.有人采用全国大中型煤炭企业的截面数据,估计生产函数模型,然后用该模型预测未来煤炭行业的产出量,这是违反了数据的( )原则。 A.一致性 B.准确性 C.可比性 D.完整性 24.判断模型参数估计量的符号、大小、相互之间关系的合理性属于( )准则。 A.经济计量准则 B.经济理论准则 C.统计准则 D.统计准则和经济理论准则
25.对下列模型进行经济意义检验,哪一个模型通常被认为没有实际价值的( )。 A.B.C.
Ci(消费)?500?0.8Ii(收入)
Qdi(商品需求)?10?0.8Ii(收入)?0.9Pi(价格)
Qsi(商品供给)?20?0.75Pi(价格)
0.60.4Y?0.65KLii(资本)i(劳动) D.(产出量)
二、多项选择题
1.对经济计量模型的参数估计结果进行评价时,采用的准则有 ( )
A.经济理论准则 B.统计准则 C.经济计量准则 D.模型识别准则 E.模型简单准则
2.经济的参数分为两大类,下面哪些属于外生参数 ( )
A.折旧率 B.税率
C.利息率 D.凭经验估计的参数 E.运用统计方法估计得到的参数
3.根据模型研究的社会经济系统的性质不同,将宏观经济计量模型分为 ( )
A.发达市场经济国家模型 B.发展中国家模型 C.中央计划经济国家模型 D.季度模型 E.地区模型
4.经济计量模型的应用方向是 ( ) A.用于经济预测 B.用于结构分析
C.用于经济政策评价 D.仅限用于经济政策评价 E.仅用于经济预测、经济结构分析 5.下列哪些变量属于前定变量 ( ) A.内生变量 B.随机变量 C.滞后变量 D.外生变量 E.工具变量
6.随机扰动项产生的原因大致包括如下几个方面,它们是 ( )
A.客观现象的随机性(人的行为、社会环境与自然影响的随机性)
B.模型省略变量(被省略的具有随机性的变量归入随机扰动项)
C.测量与归并误差(估计时测量和归并误差都归入随机扰动项)
D.数学模型函数的形式的误定 7.内生变量 ( )
B.既影响系统同时又不被该系统及其外部因素所影响
C.内生变量可分为政策性内生变量和非政策性内生变量
D.既决定该系统的其它内生变量,同时又被其它内生变量和前定变量所决定 8.外生变量 ( )
A.取决于该系统之外诸因素而不受该系统本身的影响
B.影响内生变量但不受内生变量的影响 C.在联立方程模型求解之前,外生变量的值必须预先给定
D.在联立方程模型求解之前,外生变量的值不必须预先给定
E.外生变量可分为政策性外生变量和非政策性外生变量
9.前定变量 ( )
A.包括外生变量、滞后内生变量和滞后外生变量 B.完全不决定该系统的内生变量
C.在联立方程模型求解之前,本期外生变量的值是给定的
三、填空题
D.在联立方程模型求解之前,滞后内生变量和滞后外生变量取历史值
E.在估计联立方程模型之前,只需收集前定变量的数据,无须收集设定为内生变量的数据资料 10.由于经济现象的错综复杂性,大多数经济关系或经济结构必须用联立方程模型来描述和计量。根据方程式反映的经济关系的性质,方程式分为 A.行为方程式 B.结构方程式
11.计量经济研究选择的模型的形式大多是线性函数形式,但是有一些非线性函数形式,在计量经济研究中也广泛的使用,它们是 ( ) A.一类可以线性化的非线性函数,例如幂函数可以化为双对数模型
B.双对数模型。双对数模型解释变量的回归系数弹性
C.半对数模型。半对数模型有两种形式,一种可以用来描述按常数百分率增长的模型,解释变量的斜率表示被解释变
D.倒数模型。倒数模型用以描述随着解释变量的递增,被解释变量作非线性的递减,譬如产量与生产该产品的固定费
E.EViews中无须使用特殊的NLS命令来估计这类非线性模型
12.可以作为单方程计量经济学模型解释变量的有以下几类变量( )。 A.外生经济变量 B.外生条件变量
C.外生政策变量 D.滞后被解释变量 E.内生变量 13.样本数据的质量问题可以概括为()几个方面。 A.完整性 B.准确性 C.可比性 D.一致性
E.从根本上看是由于经济活动是人类参与的活动。 ( )
A.既影响系统同时又被该系统及其外部因素所影响 C.技术方程式 D.法规方程式 E.恒等式
E.通过求解联立方程模型,才能得到内生变量的值 (斜率)可以衡量被解释变量Y关于解释变量X的
1.计量经济学是以揭示经济活动中客观存在的__________为内容的分支学科,挪威经济学家弗里希,将计量经济学定义为__________、__________、__________三者的结合。
2.数理经济模型揭示经济活动中各个因素之间的__________关系,用__________性的数学方程加以描述,计量经济模型揭示经济活动中各因素之间的关系,用__________性的数学方程加以描述。 3.经济数学模型是用__________描述经济活动。
4.计量经济学根据研究对象和内容侧重面不同,可以分为_________计量经济学和________计量经济学。
5.计量经济学模型包括________________和________________两大类。
6.建模过程中理论模型的设计主要包括三部分工作,即_____________、____________________、____________________。
7.确定理论模型中所包含的变量,主要指确定___________________。
8.可以作为解释变量的几类变量有_________变量、__________变量、_________变量和_________变量。 9.选择模型数学形式的主要依据是________________。
10.研究经济问题时,一般要处理两种类型的数据:_____________数据和_____________数据。 11.样本数据的质量包括四个方面_____________、_____________、_____________、_____________。 12.模型参数的估计包括_____________、_____________和软件的应用等内容。
13.计量经济学模型用于预测前必须通过的检验分别是_____________检验、_____________检验、_____________检验和_____________检验。
14.计量经济模型的计量经济检验通常包括随机误差项的_____________检验、_____________检验、解释变量的_____________检验。
15.计量经济学模型的应用可以概括为四个方面,即__________、__________、__________、__________。 16.结构分析所采用的主要方法是_____________、_____________和_____________。
17.计量经济学是以___________为指导,以事实为依据,以___________为方法、以___________为手段,研究经济关系和经济活动 ___ 规律及其应用,并以建立和应用经济数学模型为核心的一经济理论___________学科。
18.设计___________,并估计出模型中的参数,是计量经济学研究客观经济现象的___________。人们可以用各种各样的模型来揭示及阐明各种自然现象与社会经济现象的本质与规律,计量经济学模型属于___________中的一种。
19.经济计量模型是________研究具有________特征的经济变量关系的数学模型。注重经济变量关系的随机性特性,是计量经济学的________。而数理经济学模型所表明的各个经济变量的关系是一种确定性的联系,不考虑影响经济关系发生随机变化的随机因素。所以,计量经济学研究是一种________的研究。 20.在经济计量模型中___________反映不确定性因素影响的随机扰动项___________,目的在于使模型___________经济活动实际。
21.在经济计量模型中引入随机扰动项的理由可以归纳为如下几条:(1)因为人的行为的随机性、社会环境与自然环境的随机性决定了________;(2)建立模型时其它________的影响都归入了随机扰动项中;(3)在模型估计时,( )也都归入了随机扰动项中;(4)由于我们认识的不足,________被解释变量与解释变量之间关系的________,例如将非线性的函数形式设定为线性的函数形式,由此而产生的误差也包含在随机扰动项中了,等等。
22.计量经济学研究的整个建摸过程可分为三个重要阶段:(1)___________阶段;(2)___________阶段;(3)___________阶段。
23.研究经济问题时,一般要处理三种类型的数据:(1)___________数据;(2)___________数据;和(3)___________数据。平行数据是(1)和(2)种数据的___________
24.度量___________的变化大小,自然要选定一个标准,这个标准就是各自的___________,即变量在几个标准差范围内变化。度量两个变量协同___________变化的统计量叫___________。协方差采用两个变量各自离均差的乘积,加总即___________,然后消除观察个数的影响再除以个数n。
3.考虑以下预测的回归方程: 其中,
?RSt ; R2=0.50 Yt=-120 +0.10Ft +5.33
Yt=第t年的玉米产量(公斤/亩);Ft=第t年的施肥强度(磅/亩);
RSt=第t年的降雨量(吋)。 请回答以下问题:
(1) 从F和RS对Y的影响方面,仔细说出本方程中系数0.10和5.33的含义。
(2) 常数项-120是否意味着玉米的负产量可能存在? (3) 假定?F的真实值为0.4,则估计值是否有偏?为什么?
(4) 假定该方程并不满足所有的古典模型假设,即并不是最佳线性无偏估计量,则是否意味着真实值绝对不等于5.33?为什么?
4.对下列模型进行适当变换化为标准线性模型:
?RS的
11??22?????Q?ALKe xx(1);(2)
1y??0??1.x??1?e?(?0??1x??) (3) y?e; (4)
y??0??15. 给定二元回归模型:Yt??0??1X1t??2X2t?et ( t =1,2,?,T) (1)叙述模型的古典假定
(2)写出总体回归方程、样本回归方程、样本回归模型 (3)写出总体回归模型与样本回归模型的矩阵表示
(4)写出回归系数及随即扰动项方差的最小二乘估计量,并叙述参数估计量的统计性质 (5)试述总离差平方和、回归平方和、残差平方和之间的关系及其自由度之间的关系
6.某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为
edu?10.36?0.094sibs?0.131medu?0.210fedu
2
R=0.214
式中,edu为劳动力受教育年数,sibs为该劳动力家庭中兄弟姐妹的个数,medu与fedu分别为母亲与父亲受到教育的年数。问
(1)sibs是否具有预期的影响?为什么?若medu与fedu保持不变,为了使预测的受教育水平减少一年,需要sibs增加多少?
(2)请对medu的系数给予适当的解释。
(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为12年,另一个的父母受教育的年数为16年,则两人受教育的年数预期相差多少?
7. 以企业研发支出(R&D)占销售额的比重为被解释变量(Y),以企业销售额(X1)与利润占销售额的比重(X2)为解释变量,一个有32容量的样本企业的估计结果如下:
Y?0.472?0.32log(X1)?0.05X2(1.37)(0.22)(0.046)
R2?0.099其中括号中为系数估计值的标准差。
(1)解释log(X1)的系数。如果X1增加10%,估计Y会变化多少个百分点?这在经济上是一个很大的影响吗?
(2)针对R&D强度随销售额的增加而提高这一备择假设,检验它不虽X1而变化的假设。分别在5%和10%的显著性水平上进行这个检验。
(3)利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响?
8.在多元线性回归分析中,为什么用修正的决定系数衡量估计模型对样本观测值得拟和优度? 9.决定系数R与总体线性关系显著性F检验之间的关系?
10.在多元线性回归分析中,t检验与F检验有何不同?在一元线性回归分析中二者是否有等价作用?
2
七、分析计算题
1. 假定以校园内食堂每天卖出的盒饭数量作为被解释变量,盒饭价格、气温、附近餐厅的盒饭价格、学校当日的学生数量(单位:千人)作为解释变量,进行回归分析;假设不管是否有假期,食堂都营业。不幸的是,食堂内的计算机被一次病毒侵犯,所有的存储丢失,无法恢复,你不能说出独立变量分别代表着哪一项!下面是回归结果(括号内为标准差):
?i?10.6?28.4X1i?12.7X2i?0.61X3i?5.9X4i Y要求:
(1)试判定每项结果对应着哪一个变量? (2)对你的判定结论做出说明。
(2.6) (6.3) (0.61) (5.9) R?0.63 n?35
22.某酒店在某个时间段内对投资的研究估计出以下收入生产函数:
R=ALαKβeε 其中,A=常数项
L=土地投入(单位面积:平方尺) K=资本投入(建设成本:千美元) R=酒店的年净收入(千美元) ε=随机误差 请回答以下问题:
(1)你认为α和β的总体值一般应为正值还是负值?在理论上如何解释? (2)为本方程建立具体的零假设和备择假设。
(3)如果显著水平为5%,自由度为26,问(2)中的两个假设应如何作出具体的决定? (4)在以下回归方程基础上计算出适当的T值,并进行t检验。
LnR=-0.91750+0.273LnL+0.733LnK (0.135) (0.125) (括号内为估计的标准差) 你是拒绝还是接受假设?
3.根据某地1961-1999年共39年的总产出Y、劳动投入L和资本投入K的年度数据,运用普通最小二乘法估计得出了下列回归方程: 问;
(1)题中所估计的回归方程的经济含义;
(2)该回归方程的估计中存在什么问题?应如何改进?
4.某公司想决定在何处建造一个新的百货店,对已有的30个百货店的销售额作为其所处地理位置特征的函数进行回归分析,并且用该回归方程作为新百货店的不同位置的可能销售额,估计得出(括号内为估计的标准差)
,DW=0.858
??30?0.1?X?0.01?X?10.0?X?3.0?XYt1t2t3t4t
(0.02) (0.01) (1.0) (1.0)
Yt=第i个百货店的日均销售额(百美元);
X 1t=第i个百货店前每小时通过的汽车数量;
其中
X2t=第i个百货店所处区域内的平均收入;
X3t=第i个百货店内所有的桌子数量 X 4t=第i个百货店所处地区竞争店面的数量 请回答以下问题:
(1) 各个变量前参数估计的符号是否与期望的符号一致? (2) 计算每个变量参数估计值的T值;
(3) 在?=0.05的显著性水平下检验各变量的显著性。 (临界值
t0.025(25)?2.06,t0.025(26)?2.056,t0.05(25)?1.708,t0.05(26)?1.706)
5.根据11个年观察值,得到下面的回归模型: 模型A:
??2.6911?0.4795XYt
se=(0.1216) (0.1140) r=0.6628
2
??0.7774?0.2530lnXYt 模型B:
se=(0.0152) (0.0494) r=0.7448
其中,Y表示每人每天消费咖啡的杯数,X表示咖啡的价格(美元/磅)。
①解释这两个模型的斜率系数。
②已知Y?2.43,X?1.11.。根据这些值估计模型A的价格弹性。 ③求模型B的价格弹性。
④从估计的弹性看,你是否能说咖啡的需求对价格是缺乏弹性的? 6.求下列情况下?。 (a)
?22
?eii2=800,n=25,k=4(包括截距)
2e(b)?=1200,n=14,k=3(不包括截距)
7. 下表给出了三变量模型的回归的结果:
(a) 样本容量是多少? (b) 求RSS?
(c) ESS与RSS的自由度各是多少?
22
(d) 求R与R?
(e) 检验假设:X2和X3对Y无影响。你用什么假设检验?为什么? 根据以上信息,你能否确定X2和X3各自对Y的贡献吗?
平方和的均值
方差来源 平方和(SS) 自由度(d.f.)
(MSS) 来自回归(ESS) 来自残差(RSS) 总离差(TSS)
65965 — 66042
— — 14
— —
8.为了确定对空调价格的影响因素,B.T. katchford根据19个样本数据得到回应结果如下:
Y2??68.26?0.023X2i?19.729X3i?7.653X4i R2=0.84
se= (0.005) (8.992) (3.082)
其中,Y——空调的价格/美元 X2——空调的BTU比率 X3——能量效率 X4——设定数 (a) 解释回归结果。
(b) 该回归结果有经济意义吗?
(c) 在显著水平??5%下,检验零假设:BTU比率对空调的价格无影响,备则假设:BTU比率对价
格有正向影响。
(d) 你会接受零假设:三个解释变量在很大程度上解释了空调价格的变动吗?详细写出计算过程。 9.经研究发现,学生用于购买书籍及课外读物的支出与本人受教育年限和其家庭收入水平有关,对18名学生进行调查的统计资料如下表所示: 学生购买书籍及课外序号 读物支出Y(元/1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 要求:
(1)试求出学生购买书籍及课外读物的支出Y与受教育年限X1和家庭收入水平X2的估计的回归方程:
年) 450.5 507.7 613.9 563.4 501.5 781.5 541.8 611.1 1222.1 793.2 660.8 792.7 580.8 612.7 890.8 1121.0 1094.2 1253.0 受教育年限 X1(年) ?家庭月可支配收入X2(元/月) 171.2 174.2 204.3 218.7 219.4 240.4 273.5 294.8 330.2 333.1 366.0 350.9 357.9 359.0 371.9 435.3 523.9 604.1 4 4 5 4 4 7 4 5 10 7 5 6 4 5 7 9 8 10 ????X???X ???Y01122(2)对?1,?2的显著性进行t检验;计算R和R;
(3)假设有一学生的受教育年限X1?10年,家庭收入水平X2?480元/月,试预测该学生全年购买书籍
22及课外读物的支出,并求出相应的预测区间(α=0.05)。
10.下表给出1980~1996年美国的城市劳动力参与率、失业率等数据。
(a)建立一个合适的回归模型解释城市男性劳动力参与率与城市男性失业率及真实的平均小时工资之间的关系。
(b)重复(a)过程,但此时的变量为女性城市劳动参与率。 (c)重复(a)过程,但此时用当前平均小时工资。 (d)重复(b)过程,但此时用当前平均小时工资。 (e)如果(a)和(c)的回归结果不同,你如何解释?
(f)如果(b)和(d)回归结果不同,你如何使回归结果合理化?
劳动力参与数据
年份 CLFPRM CLFPRF UNRM UNRF AHE82 AHE 1980 77.4 51.5 6.9 7.4 7.78 6.66 1981 77.0 52.1 7.4 7.9 7.69 7.25 1982 76.6 52.6 9.9 9.4 7.68 7.68 1983 76.4 53.9 9.9 9.2 7.79 8.02 1984 76.4 53.6 7.4 7.6 7.80 8.32 1985 76.3 54.5 7.0 7.4 7.77 8.57 1986 76.3 55.3 6.9 7.1 7.81 8.76 1987 76.2 56.0 6.2 6.2 7.73 8.98 1988 76.2 56.6 5.5 5.6 7.69 9.28 1989 76.4 57.4 5.2 5.4 7.64 9.66 1990 76.4 57.5 5.7 5.5 7.52 10.01 1991 75.8 57.4 7.2 6.4 7.45 10.32 1992 75.8 57.8 7.9 7.0 7.41 10.57 1993 75.4 57.9 7.2 6.6 7.39 10.83 1994 75.1 58.8 6.2 6.0 7.40 11.12 1995 75.0 58.9 5.6 5.6 7.40 11.44 1996 74.9 59.3 5.4 5.4 7.43 11.82 CLFPRM:城市劳动力参与率,男性,(%) CLFPRF:城市劳动力参与率,女性,(%) UNRM:城市失业率,男性,(%) UNRF:城市失业率,女性,(%) AHE82:平均小时工资,(1982美元价) AHE:平均小时工资,(当前美元价) 资料来源:《总统经济报告》,1997年
11.设某商品的需求量Y(百件),消费者平均收入X1(百元),该商品价格X2(元)。经Eviews软件对观察的10个月份的数据用最小二乘法估计,结果如下:(被解释变量为Y) VARIABLE COEFFICIENT STD.ERROR T-STAT 2-TAILSIG C 99.469295 13.472571 7.3830965 0.000 X1 2.5018954 0.7536147 ( ) X2 - 6.5807430 1.3759059 ( ) R-squared 0.949336 Mean of dependent var 80.00000 Adjusted R- squared ( ) S.D. of dependent var 19.57890 S.E of regression 4.997021 Sum of squared resid 174.7915 Durbin-Watson stat ( ) F – statistics ( )
31.在双变量回归模型中,若扰动项?i服从正态分布,则b2可能是B2的更为准确地估计值。 32.r是TSS/ESS的比值。
33.给定显著水平?及自由度,若计算得到的t值超过临界的t值,我们将接受零假设。 34.相关系数r与斜率b2同号。 六、简答题
1.简述随机扰动项产生的原因?
2.什么叫预测检验?怎样进行预测检验?检验预测检验的评价指标是哪些? 3.试说明样本判定系数R为什么可以用来衡量拟合优度?
4.在多元线性回归模型估计中衡量拟合优度,为什么要计算校正判定系数?校正判定系数受哪些因素影响?
5.统计学T检验的步骤是什么?
6.为什么进行了回归方程的F检验,还必须对回归系数的估计值进行t检验? 7.线性回归模型的基本假设有哪些? 8.试述判定系数的性质。
9.随机的总体回归函数与随机的样本回归函数有何区别?
10.评论“既然我们不能观察到总体回归函数,为什么还要研究它呢?”
11.下表列出了若干对自变量与因变量。对每一对变量,你认为它们之间的关系如何?是正的?负的?还是无法确定?也就是说,其斜率是正还是负,或都不是?并说明理由。 因变量 自变量 (a)GNP 利率 (b)个人储蓄 利率 (c)小麦产出 降雨量 (d)美国国防支出 前苏联国防开支 (e)棒球明星本垒打的次数 其年薪 (f)总统身誉 任职时间 (g)学生第一年考试成绩平均分数 其S.A.T分数 (h)学生经济计量学成绩 其统计学成绩 (i)日本汽车的进口量 美国人均国民收入 12.给定一元线性回归模型:
2
2
Yt??0??1Xt??t t?1,2,?,n
(1)叙述模型的基本假定; (2)写出参数
?0和?1的最小二乘估计公式;
(3)说明满足基本假定的最小二乘估计量的统计性质; (4)写出随机扰动项方差的无偏估计公式。
13.对于多元线性计量经济学模型:
Yt??1??2X2t??3X3t????kXkt??t t?1,2,?,n
(1)该模型的矩阵形式及各矩阵的含义; (2)对应的样本线性回归模型的矩阵形式; (3)模型的最小二乘参数估计量。
14.从经济学和数学两个角度说明计量经济学模型的理论方程中必须包含随机误差项。 15.随机误差项包含哪些因素影响。
16.非线性计量模型转化成线性模型数学处理方法。
17.线性回归模型的基本假设。违背基本假设的计量经济模型是否可以估计。 18.最小二乘法和最大似然法的基本原理。 19. 下列假想的计量经济模型是否合理,为什么? (1)GDP?????iGDPi??
其中,GDPi(i?1,2,3)是第i产业的国内生产总值。 (2)S1????S2??
其中,S1 、S2分别为农村居民和城镇居民年末储蓄存款余额。 (3)Yt????1It??2Lt??
其中,Y、I、L分别为建筑业产值、建筑业固定资产投资和职工人数。 (4)Yt????Pt??
其中,Y、P分别为居民耐用消费品支出和耐用消费品物价指数。 (5)财政收入?f(财政支出)?? (6)煤炭产量?f(L,K,X1,X2)??
其中,L、K分别为煤炭工业职工人数和固定资产原值,X1、X2分别为发电量和钢铁产量。 20.普通最小二乘法参数估计量的统计性质及其含义。 21.最小样本容量、满足基本要求的样本容量。 22.为什么要计算调整后的可决系数?
23.拟合优度检验与方程显著性检验的区别与联系。 24.如何缩小参数估计量的置信区间。 25.如何缩小被解释变量预测值的置信区间。 七、分析计算题 1.对于模型
Yi=a+bXi+ui i=1,2,??n 从10个观测值中计算出:
∑Yi=8 ∑Xi=40 ∑Yi=26 ∑Xi=200 ∑XiYi=20 (1)、求出模型中的a和b的估计量;
2
2
(2)、当X=10时,计算Y的预测值。 2、现有x和Y的样本观测值如下表。
x 2 5 10 4 10 Y 4 7 4 5 9
2假设Y对X的回归模型为Yi?a??Xi?ui,且Var(ui)??2X,试用适当的方法估计i此回归模型。3、某国连续五年的个人消费支出(Y)和个人可支配收入(X)的数据为下列所示:
Y(千亿美元) X(千亿美元)
试求个人消费支出(Y)关于个人可支配收入(x)的线性回归方程。 4.下面的数据是从某个行业的5个不同的工厂收集的:
总成本(Y) 70 50 60 75 68 产 量(X) 11 5 7 12 9 请回答下列问题:
1)、估计这个行业的线性总成本函数
6.7 7.5 7.0 7.8 7.4 8.1 7.7 8.6 7.6 8.6
?X??y???? ?和?的经济意义是什么? 2)、模型中?3)、估计产量为10时的总成本 。 5.利用下面的数据
(Y) 6 11 17 8 13 (X) 1 3 5 2 4
请回答下列问题:
??????X。 1)、进行最小二乘法估计y2)、计算判定系数R 3)、求理论值Y和残差u
6.根据抽样调查,得到一组有关大学毕业生的工作年数与相应的收入水平的数据,下表是从产业合计中得到的一组数据
2
??工作年数X 相应收入Y 1.3 213 4.2 262 8.5 340 12.7 429 17.6 523 22.3 597 27.1 670 估计方程Y=α+ βX+μ的参数值.
7.根据8个企业的广告支出X和销售收入Y的资源,求得:
, , , ,
试用普通最小二乘法确定销售收入Y对广告支出X的回归直线,并计算判定系数。 8.假设某国的货币数量与国民收入的历史数据已知.: n=11,
?x?99.1,?y?48.2,?xy?426.11,
?207.86,?x2?876.23
?y2(1)估计方程Y=α+βX的参数值. (2)当X=13时,Y的值是多少? 9.下面是关于两个变量X和Y的观察值 X Y 2 3 4 5 3.1 2.9 2.7 2.6 估计方程Y=α+β/X+μ的参数值. 10.假设某国的货币数量与国民收入的历史数据已知.: n=11,
?x?99.1,?y?48.2,?xy?426.11,
?207.86,?x2?876.23
?y2(1)估计方程Y=α+βX的参数值. (2)当X=13时,Y的值是多少?
11.某国连续五年的个人消费支出(Y)和个人可支配收入(X)的数据为下列所示:
Y(千亿美元) X(千亿美元)
6.7 7.5
7.0 7.8
7.4 8.1
7.7 8.6
7.6 8.6
试求个人消费支出(Y)关于个人可支配收入(x)的线性回归方程。
12.下表给出了每周家庭的消费支出Y(美元)与每周家庭的收入X(美元)的数据。 每周收入(X)
80 100 120 140 160 180 200 220
每周消费支出(Y) 55,60,65,70,75 65,70,74,80,85,88 79,84,90,94,98
80,93,95,103,108,113,115 102,107,110,116,118,125 110,115,120,130,135,140 120,136,140,144,145
240 135,137,140,152,157,160,162
(a) 对每一收入水平,计算平均的消费支出E(Y/Xi),即条件期望值。 (b) 以收入为横轴,消费支出为纵轴作散点图。 (c) 在该散点图上,作出(a)中的条件均值点。
(d) 你认为X与Y之间,X与Y的均值之间的关系如何? (e) 写出其总体回归函数及样本回归函数。 总体回归函数是线性的还是非线性的?
13.依据美国1970~1983年的数据,得到下面的回归结果:
GNPt=-787.4723+8.0863M1t r2=0.9912
Se=( ) (0.2197) t=(-10.0001) ( )
其中,GNP是国民生产总值(单位是亿美元),M1是货币供给(单位是百万美元)
注:M1包括现金、活期存款、旅游支票等 (a) 填充括号内缺省的数。
(b) 货币学家认为:货币供给对GNP有显著的正面影响,你如何检验这个假设? (c) 负的截距有什么意义?
假定1984年M1为552亿美元,预测该年的平均GNP?
14.政治的商业周期:经济事件会影响总统选举吗?为了检验称之为政治商业周期理论,Garm Smity 依据1928~1980年间,每四年总统选举的数据得到如下的回归结果:
Yt?53.10?1.70Xt
t=(34.10) (-2.67) r2=0.685
其中,Y表示收到的公众投票(%),X表示失业率的变化——选举年的失业率减去上一年的失业率。 (a) 先验地,你预期X的符号为正还是负?
(b) 该回归结果证实了政治商业周期理论吗?写出你的求证过程。 (c) 1984~1988年的总统选举的结果是否验证了该理论? 如何计算b1和b2的标准差?
15.为了研究美国制造业设备利用与通货膨胀之间的关系,Thomas A. Gittings根据1971~1988每年的数据得到下面的回归结果:
?Yt??70.85?0.8880Xt
(-5.89) (5.90) r2=0.685
其中,Y表示通货膨胀的变化(以批发价格指数来衡量),X表示设备利用率。 (a) 先验地,你认为X与Y正相关吗?为什么? (b) 如何解释该回归方程中的斜率?
?
(c) 估计的斜率值是统计上显著的吗? (d) 它是否显著不为1?
16.下表给出了1974~1986年间制造业中的税后利润X(亿美元)以及三月期现金利息Y(亿美元)的数据。
美国制造业中现金利息(Y)与税后利润(X)
年 份 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986
Y(百万美元)
19467 19968 22763 26585 28932 32491 36495 40317 41259 41624 45102 45517 46044
X(百万美元)
58747 49135 64519 70366 81148 98698 92579 101302 71028 85834 107648 87648 83121
资料来源:Business Statistics,1986,U.S.Department of Commerce, Bureau of Economic Analysis, December 1987,p.72.
(a) 你预期现金与税后利润的关系如何? (b) 作Y与X间的散点图。 (c) 该散点图是否与你的预期相符?
(d) 如果是的,运用OLS进行回归,并求出一般统计量。
(e) 对真实斜率建立一个99%置信区间并检验假设:真实的斜率为零;即现金利息与税后利润之间
不相关。
17.下表给出了1973~1987年间美国商业部提供的真实工资数Y(1997=100)与小时产出X。 (a) 经济理论表明收入与生产关系之间存在正相关。作出X与Y间的散点图看是否支持该理论。 (b) 如果是,运用普通最小二乘法进行回归分析。
(c) 收入是生产力的函数还是生产力是收入的函数?你是如何决定的?
年 份 1973 1974 1975 1976 1977
Y 96.8 95.4 96.0 98.8 100.0
X 95.9 93.9 95.7 98.3 100.0
1978 1979 1980 1981 1982 1983 1984 1985 1986 1987
100.9 99.4 96.7 95.8 97.3 98.2 97.9 98.8 101.2 101.5
100.8 99.6 99.3 100.7 100.3 103.0 105.5 107.7 110.1 111.0
资料来源:Economic Peport of President,1989,Table B-46,p.360.
18.某农产品试验产量Y(公斤/亩)和施肥量X(公斤/亩)7块地的数据资料汇总如下:
?X?xi2i?Y?3050
?1217.71y?8371.429xy ? ??255
i2iii?3122.857
后来发现遗漏的第八块地的数据:
X8?20,Y8?400。
要求汇总全部8块地数据后分别用小代数解法和矩阵解法进行以下各项计算,并对计算结果的经济意义和统计意义做简要的解释。
1.该农产品试验产量对施肥量X(公斤/亩)回归模型Y?a?bX?u进行估计。 2.对回归系数(斜率)进行统计假设检验,信度为0.05。 3.估计可决系数并进行统计假设检验,信度为0.05。 4.计算施肥量对该农产品产量的平均弹性。
5.令施肥量等于50公斤/亩,对农产品试验亩产量进行预测,信度为0.05。 6.令施肥量等于30公斤/亩,对农产品试验平均亩产量进行预测,信度为0.01。
所需临界值在以下简表中选取:
t0.025,6 = 2.447 t0.025,7 = 2.365 t0.025,8 = 2.306 t0.005,6 = 3.707 t0.005,7 = 3.499 t0.005,8 = 3.355 F0.05,1,7 = 5.59 F0.05,2,7 = 4.74 F0.05,3,7 = 4.35 F0.05,1,6 = 5.99 F0.05,2,6 = 5.14 F0.05,3,6 = 4.76
第三章 多元线性回归模型
一、单项选择题
1.在多元线性回归分析中,修正的决定系数R与一般决定系数R之间( ) A、R≤R B、R≥R C、R只能大于零 D、R可能为负值
2.设k为回归模型中的参数个数,n为样本容量。则对总体回归模型进行显著性检验(F检验)时构造的F统计量为( )
22222222ESS/(k?1)ESS/(k?1)B.F?1?RSS/(n?k)RSS/(n?k)
ESSRSSC. F?D.F?RSSESSA. F?3.线性回归模型Yi??0??1X1i??2X2i?????kXki??i中,检验H0:
时,所用
的统计量 服从( )
A.t(n-k+1) B.t(n-k-2) C.t(n-k-1) D.t(n-k+2)
e4.已知三元线性回归模型估计的残差平方和为?ut的方差估计量S2为( )。
2t?800,估计用样本容量为n?24,则随机误差项
A、33.33 B、 40 C、 38.09 D 、36.36
5. 多元线性回归模型中的系数估计式为( )
?1?1?1??1??(X???(X?1X)?1X???(X???(X?????X)XY?Y?X)XY?X)X?Y A B C D
6.在由n=30的一组样本估计的、包含3个解释变量的线性回归模型中,计算的可决系数为0.8500,则调
整后的可决系数为( )
A 0.8603 B 0.8389 C 0.8655 D 0.8327
7.用一组有30个观测值的样本估计模型Yt??0??1X1t??2X2t??t后,在0.05的显著性水平上对?1的显著性作t检验,则?1显著地不等于零的条件是其统计量t大于等于( ) A. t0.05(30) B. t0.025(28) C. t0.025(27) D. F0.025(1,28) 8.设k 为模型中的参数个数,则回归平方和是指( ) A.
B.
2 C. 2 D. 2???(Y?Y)(Y?Y)(Y?Y)/(k?1)?i?i?i?(Yi?Y)29.如果两个经济变量X与Y间的关系近似地表现为当X发生一个绝对量变动(?X)时,Y有一个固定的相对量(?Y/Y)变动,则适宜配合的回归模型是( ) A.Yt??0??1Xt??t B. lnYt??0??1Xt??t C. Yt??0??11??t D. lnYt??0??1lnXt??t Xt10.在线性回归模型中,若解释变量X1和X2的观测值成比例,既有则表明模型中存在( )。
X1i?kX2i,其中k为非零常数,
A.方差非齐性 B.多重共线性 C.序列相关 D.设定误差
11.在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在( )。
A.多重共线性 B.异方差性 C.序列相关 D.高拟合优度
12.某企业的生产决策是由模型
St??0??1Pt??t描述(其中St为产量,Pt为价格)
,又知:如果该
企业在t?1期生产过剩,决策者会削减t期的产量。由此判断上述模型存在( )。 A. 异方差问题 B. 序列相关问题 C. 多重共线性问题 D. 随机解释变量问题
二、多项选择题
1.通常选择线性函数的形式时,一般还应当( )
A.强制回归直线通过原点,这样才能最客观地反映经济规律 B.不强制回归直线通过原点,这样才能最客观地反映经济规律 C.强制回归直线通过原点,除非客观经济规律本身是通过原点的 D.不强制回归直线通过原点,如果客观经济规律是通过原点的,此时得到的回归截距与零没有本质的差异,否则得到的回归截距与零有本质的差异。 2.影响预测精度的因素包括( )
A.样本容量愈大,预测的方差愈小,预测的精度愈大
B.样本中解释变量的离均差愈大,预测的方差愈小,预测的精度愈大
C.内插预测的精度比较有把握,外推预测的能力显著下降,预测精度难以把握
D.当其样本容量n相当大,而预测点的取值X0接近于X的平均值时,预测的方差最小,预测的精度最大 E.残差标准差的估计值愈小,回归预测的精度愈精确,所以常常把残差标准差的估计值作为预测精度的标志
2
3.可决系数R是表示多个解释变量与被解释变量之间相关程度的统计量。所以()
A.它作为拟合优度的度量,衡量多元回归方程对因变量的变差可以作出解释的比例,取值在0与1之间
2
B.可决系数R对于包含在模型中的解释变量的数目容易作出灵敏的反映,它是解释变量数目的非递减函数
2
C.可决系数R只反映了度量变异两个方面--平方和与自由度中的前一个方面,因此需要用各个平方和对应的自由度进行校正
22
D.可决系数R必定是非负的,但校正可决系数R则可以为负
2
E.尽管如此,要建立一个好的模型不能仅仅追求最高的可决系数R,很大程度上还取决于建立模型之前的定性分析
4.不满足OLS基本假定的情况,主要包括:( ) A.随机序列项不是同方差,而是异方差 B.随机序列项序列相关,即存在自相关
C.解释变量是随机变量,且与随机扰动项相关 D.解释变量之间相关,存在多重共线性
5.对模型Yt??0??1X1t??2X2t??t进行总体显著性检验,如果检验结果总体线性关系显著,则有( )
A.?1??2?0 B. ?1?0,?2?0 C. ?1?0,?2?0 D. ?1?0,?2?0 E. ?1??2?0
三、填空题
1.在多元线性回归模型中,解释变量间呈现线性关系的现象称为______ ____问题,给计量经济建模带来不利影响,因此需检验和处理它。
2.检验样本是否存在多重共线性的常见方法有:____ ______和逐步回归法。 3.处理多重共线性的方法主要有两大类:______ ____和____ ______。 4.普通最小二乘法、加权最小二乘法都是____ ______的特例。 5.随机解释变量
Xi与随机误差项?相关,可表示为_____ _____。
6.工具变量法并没有改变原模型,只是在原模型的参数估计过程中用工具变量“替代” ____ ______。 7.对于模型
Yi??0??1X1i??2X2i????kXki??i,i=1,2,?,n,若用工具变量Z代替其中的随机
解释变量X2,则采用工具变量法所得新的正规方程组仅仅是将原正规方程组中的方程
?YXi2i????X???X?????XX???011i22ikki2i用方程____________ ________代替,而其
??他方程则保持不变。
8.狭义工具变量法参数估计量的统计性质是小样本下____ ______,大样本下_____ _____。 9.对于线性回归模型
Yi??0??1X1i??2X2i????kXki??i,i=1,2,?,n,其矩阵表示为
Y?XB?N。若用工具变量Z代替其中的随机解释变量X2,则采用工具变量法所得参数估计量的矩
阵表示为_____ _____,其中Z被称为_______ ___。
10.以截面数据为样本建立起来的计量经济模型中的随机误差项往往存在___ _______。 11.以时间序列数据为样本建立起来的计量经济模型中的随机误差项往往存在_____ _____。
四、判断题
1.有效估计量的方差最小。
2.OLS就是使残差平方和最小化的过程。
3.如果存在异方差,通用的T检验和F检验是无效的。 4.高斯-马尔可夫定理是OLS的理论依据。
5. 无论模型中包含多少个解释变量,总离差平方和的自由度总为(n-1)。 6.只有当ui服从正态分布时,b 1b 2也才服从正态分布。
7.校正的判定系数和非校正的判定系数仅当非校正系数为1时才相等。
8.判定所有解释变量是否对因变量有显著影响的方法是看是否每个解释变量都是显著的t统计量;如果不是,则解释变量整体是不显著的。 9.当R=1,F=0;当R=0,F=∞。
10.在模型Yi?B1?B2X2i?B3X3i??i中,如果X2和X3负相关且B3>0,则从模型中略去解释变量X3将使b12的值减小[也即,E(b12)<(B2)] 。其中b12是Y仅对X2的回归方程中的斜率系数。 11.当我们说估计的回归系数在统计上是显著的,意思是说它显著不为1。 12.要计算t临界值,仅仅需知道自由度。
13.整个多元回归模型在统计上是显著的意味着模型中任何一个单独得变量均是统计显著的。 14.就估计和假设检验而言,单方程回归与多元回归没有什么区别。 五、名词解释
1.偏回归系数 2.多元判定系数R 3.正规方程组 4.多重共线性 5.单个假设检验 6.联合假设检验 7.校正判定系数 R 六、问答题
1.在5项基本假定成立的条件下,运用OLS法推证总体模型Y=β0+β1X1+β2X2+?βkXk+μ的正规方程。 2.设回归模型为:Yi??0??1X1i??2X2i??i ( t =1,2,?, T) (1)用矩阵表示该线性模型。
(2)用矩阵表示上述线性模型的正规方程的系数矩阵和正规方程的右端。 (3)用矩阵形式求上述模型的最小二乘解。 (4)写出 ei方差的估计量
22
2
2
5. 1964年,对9966名经济学家的调查数据如下:
年龄/岁 20~24 25—29 30—34 35—39 40~44 45—49 50—54 55—59 60—64 65—69 70+
中值工资/美元
7800 8400 9700 11500 13000 14800 15000 15000 15000 14500 12000
资料来源:“The Structure Of Economists’Employment and Salaries,”Committee On the National Science Foundation Report On the EconOmlCs Profession,American Economics Review,V01.55,NO.4,December 1965,p.36.
(a) 建立适当的模型解释平均工资与年龄间的关系。为了分析的方便,假设中值工资是年龄区间中点的
工资。
(b) 假设误差与年龄成比例,变换数据求得WLS回归方程。 (c) 现假设误差与年龄的平方比例,求WLS回归方程。 (d) 哪一个假设看来更可行?
6. 加权最小二乘法。考虑表1中的数据。
表1 美国制造业平均赔偿与就业规模所决定的生产率之间的关系
赔偿的标准方差 就业规模 平均赔偿 平均生产率
?i/美元 (平均就业人数) Y/美元 X/美元
1—4 3 396 3 396 744
5—9 3787 3787 851
4013 4013 728 10~19
4104 4104 805 20—49
4146 4146 930 50—99
424l 424l 1081 100—249
4387 4387 1243 250—499
4538 4538 1308 500—999
4843 4843 1 112 1 000—2499
数据来源:The census Of Manufacturing,U.SDepartment Of Commerce,1958。(表中的数字由D.N.Guianati 计算)
(a)估计OLS回归方程:Yi?B1?B2Xi?ui (b)估计WLS
Yi?i?B11?i?B2Xi?i??i ?i(确保运行的WLS通过原点。)计算两个回归方程的结果。你认为哪个回归方程更好?为什么?
227. 按照(white)回归方程 ei2?A1?A2X2i?A3X3i?A4X2i?A5X3i?A6X2iX3i??i的过程校正了异方差之后,方程Yi?111.78?0.0042X2i?0.4898X3i的回归结果如下:(注:为了节省空间,我们只给出了t统计量和它们的p值)
22Yt?4987?0.4718X2i?0.8442X3i?0.0000102X2?0.4435XX2iX3i i3i?0.0026?? t= (4.86) (-0.59) (-2.45) (1.27) (1.62) (0.35)
p值=(0.000) (0.566) (0.028) (0.223) (0.127) (0.731) R=0.649
(a)你如何解释上述回归方程?
(b)下面的回归方程给出了White异方差检验的结果,
该结果表明回归方程Yi?111.78?0.0042X2i?0.4898X3i存在着异方差问题。你将对数据采取什么变换以消除异方差?给出必要的计算步骤。 (c)你如何确定(b)中所选的模型是否存在异方差问题?
?2
20(0.649)=12.98
第五章 自相关
一、单项选择题
1. 自相关系数ρ的取值范围是( )
A 0<ρ<1 B -1<ρ<0 C -1<ρ<1 D 1<ρ<+∞
2.已知样本回归模型残差的一阶自相关系数接近于-1,则DW统计量近似等于( ) A.0 B.1 C.2 D.4
3.假设回归模型为 Yi=β0+β1Xi+μi其中Xi为随机变量,Xi与Ui相关则 Yi的普通最小二乘估计量( ) A.无偏且一致 B.无偏但不一致 C.有偏但一致 D.有偏且不一致 4.用于检验序列相关的DW统计量的取值范围是( ) A.0≤DW≤1 B.-1≤DW≤1 C. -2≤DW≤2 D.0≤DW≤4
5.在给定的显著性水平之下,若DW统计量的下和上临界值分别为dL和du,则当dL A.存在一阶正自相关 B.存在一阶负相关 C.不存在序列相关 D.存在序列相关与否不能断定 6.序列相关性是违背以下哪条假设( ) 2 A cov(μi, μj)= 0 B V(μi)= ζC 所有自变量线性无关 D cov(μi, Xj)= 0 7.对于回归模型 ,检验随机误差项是否存在自相关的统计量为( ) A. 8.对于部分调整模型用( ) B. C. D. ,若ut不存在自相关,则估计模型参数可使 A.普通最小二乘法 B.加权最小二乘法 C.广义差分法 D.一阶差分法 9.若回归模型中的随机误差项存在一阶自回归形式的序列相关,则估计模型参数应采用( ) A.普通最小二乘法 B.加权最小二乘法 C.广义差分法 D.工具变量法 10.已知样本回归模型残差的一阶自相关系数接近于-1,则DW统计量近似等于( ) A.0 B.1 C.2 D.4 11.假设回归模型中的随机误差项ut具有一阶自回归形式:ut??ut?1?vt,其中E(vt)?0,Var(vt)??2v。则ut的方差Var(ut)为() ?2vA.Var(ut)?1??2?1??2B.Var(ut)???v1??22C.Var(ut)?12.用矩阵形式表示的广义最小二乘参数估计量为 ?2?v2D.Var(ut)?1??2 ??(X'??1X)?1X'??1Y?,此估计量为( )。 A.有偏、有效的估计量 B.有偏、无效的估计量 C.无偏、无效的估计量 D.无偏、有效的估计量 13.采用广义最小二乘法关键的一步是得到随机误差项的方差—协方差矩阵Ω,这就需要对原模型 Y?X??N首先采用( )以求得随机误差项的近似估计量,从而构成矩阵Ω的估计量。 A.一阶差分法 B.广义差分法 C.普通最小二乘法 14.假定正确回归模型为Y??0??1X1??2X2?u,若遗漏了解释变量X2,且X1、X2线性相关则?1的普 通最小二乘法估计量( ) A.无偏且一致 B.无偏但不一致 C.有偏但一致 D.有偏且不一致 二、多项选择题 1.这里自相关指随机扰动项的逐次值之间的相关,那么( ) A.被解释变量的自相关必然引起随机扰动项之间的自相关 B.这种自相关也分为正自相关和负自相关 C.由于这种自相关的存在,利用普通最小二乘法得到的参数估计仍然保持着无偏性 D.由于这种自相关的存在,利用普通最小二乘法得到的参数估计失去了最小方差特性 E.由于这种自相关的存在,利用ei=/(n-k-1)作为随机扰动项方差的估计值,有可能低估 2.Durbin-Watson检验的适用条件是( ) A.随机扰动项一阶自相关 B.解释变量与随机扰动项不相关 三、填空题 1.在残差et和滞后一期残差et-1的散点图上,如果,残差et在连续几个时期中,逐次值 改变符号,即图形 ,那么残差et具有 ;如果,残差et在连续几个时期中,逐次值 的改变符号,而是几个负的残差et以后跟着几个正的残差et,然后又是几个负的残差et,.....,那么残差et具有 。 2.序列自相关的来源有 。 (1) ;(2) (例如随机的自然灾害持续几年); (3) ;(4) 造成自相关。 2 C.样本容量比较大(临界值表要求n等于大于15) D.解释变量中包含滞后一期的因变量 3.Durbin-Watson检验的步骤( ) A.提出假设:H0:ρ= 0 HA: ρ≠0 B.构造dw统计量 C.检验判断:正自相关、无自相关、负自相关或者不能检出 D.dw=2,则不存在随机扰动项的自相关 4.序列相关性的解决方法有( ) A.广义差分法 B.WLS C.杜宾两步法 D.格莱泽检验法 E.GLS 5.序列相关性的检验方法有( ) A.D-W法 B.图示法 C.帕克检验法 D.格莱泽检验法 E.GLS 工具变量应具备的条件:选择的工具变量(1)与 不相关;(2)与 。 四、名词解释 1.自相关性 2.一阶自相关 3.空间相关 五、判断题 1.参数的估计量是随机变量,但参数本是非随机的或是固定的。 2.当模型存在高阶自相关时,可用D-W法进行自相关检验。 3.当模型的解释变量包括内生变量的滞后变量时,D-W检验就不适用了。 4.DW值在0和4之间,数值越小说明正相关程度越大,数值越大说明负相关程度越大。 5.假设模型存在一阶自相关,其他条件均满足,则仍用OLS 法估计未知参数,得到的估计量是无偏的,不再是有效的,显著性检验失效,预测失效。 6.当存在自相关时,普通最小二乘法估计量是有偏的且失去有效性。 7.在自回归模型中,由于某些解释变量是被解释变量的滞后变量,如: yt=β1十β2xt+β1yt-1+μt 那么D-W法不适用。 8.在D-W检验法中,我们假定误差项的方差为同方差。 9.在用一阶差分法消除自相关时,我们假定自相关系数ρ=1 10.序列自相关的来源有模型设计不当; 11.序列自相关的来源有随机扰动项本身的自相关; 12.序列自相关的来源有经济惯性; 13.当存在自相关时,OLS估计量是有偏的并且也是无效的。 14.杜宾—瓦尔森d统计量检验假设误差项的同方差。 15.消除自相关的一阶差分变换假定自相关系数?必须等于1。 六、简答题 1.怎样发现序列相关?如果某种常用的检验序列相关的方法失效怎么办?至少举出两个克服序列相关的方法。 2.试述Dubin-Watson统计量的定义、涵义、功能、概率密度分布图并在图上标出正自相关区、负自相关区、无结论区和无自相关区。DW检验的局限性主要有哪些? 3.举例说明经济现象中的自相关性的存在。 4.什么是一阶自相关和高阶自相关? 5.在处理自相关问题时,我们通常假设其为一阶自相关。请说明其重要性。 6.考虑以下回归模型: yt=2.7十0.04xt+0.9yt-1 R2=0.98 并且杜宾一沃森统计值为:DW=1.96,样本容量为100。你能得出残差不存在序列相关或者存在序列相关的结论吗?解释你的结论。 7.有如下一个回归方程,共95个样本点: yt=1.3+9.23x1t+1.8x2t- 408x3t+11.9 x4t DW=0.95 8.写出D-w检验法的步骤,并根据给出的数值,判断该模型是否存在自相关性。 9.下面的回归方程是由OLS法得到的,样本点是24个 yt=13+2.7 xt, DW=1.3l 判断是否存在自相关性。 10.简述样本相关系数的性质。 11.有如下一个回归方程,共95个样本点: yt=1.3+9.23x1t+1.8x2t- 408x3t+11.9 x4t DW=0.95 写出D-w检验法的步骤,并根据给出的数值,判断该模型是否存在自相关性。 12.考虑以下回归模型: yt=2.7十.04xt+0.9yt-1 R2=0.98 并且杜宾一沃森统计值为:DW=1.96,样本容量为100。你能得出残差不存在序列相关或者存在序列相关的结论吗?解释你的结论。 13.马尔可夫一阶自相关假定有何重要意义? 14.在AR(1)假定下,古典线性回归模型的假定之一,总体概率分布函数中的误差项不相关 的后果是什么? 15.在存在AR(1)自相关的情形下,什么估计方法能够产生BLUE估计量?简述这个方法的 具体步骤。 16.在存在AR(1)的情形下,估计自相关参数p有哪些不同的方法? 17.诊断自相关有哪些不同的方法?说明每一种方法所隐含的假设。 18.杜宾—瓦尔森d统计量虽广泛使用,但它有什么缺陷? 七、计算分析题 1.根据我国1978--2000年的财政收入Y和国内生产总值X的统计资料,可建立如下的计量经济模型: Y?556.6477?0.1198?X (2.5199) (22.7229) R=0.9609,S.E=731.2086,F=516.3338,D.W=0.3474 请回答以下问题: (1) 何谓计量经济模型的自相关性? (2) 试检验该模型是否存在一阶自相关,为什么? (3) 自相关会给建立的计量经济模型产生哪些影响? (4) 如果该模型存在自相关,试写出消除一阶自相关的方法和步骤。 2d?1.43) (临界值dL?1.24,U2.利用以下给定的杜宾-袄森d统计数据进行序列相关检验。 (1)d=2.64,k’=4,n=35,显著水平α=5% dL=1.22 du=1.73 (2)d=1.75,k’=1,n=45,显著水平α=5%.dL=1.48 du=1.57 (3)d=0.91,k’=2,n=28,显著水平α=5%.dL=1.26 du=1.56 (4)d=1.03,k’=5,n=26,显著水下α=5% dL=0.98 du=1.88 3. 完成下表: 样本数 25 30 50 60 200 解释变量数 2 5 8 6 20 杜宾—瓦尔森d统计量 0.83 1.24 1.98 3.72 1.6l 自相关证据 有 4. 在研究工人在价值增值中所占份额(也即说劳动力的份额)的变化中,根据1949—1961年期间美国的数据,得到如下回归结果(t比例值在括号中): 模型A:Yt?0.4529?0.0041t r=0.5284; d=0.8252 模型B:Yt?0.4786?0.00127t?0.0005t r=0.5284; d=1.82 2 ?2 ?t=(-3.9708) 2 t= (-3.2724) (2.7777) 其中,Y=劳动份额,t=时间。 (a)在模型A中存在序列相关吗?模型B呢? (b)如果在模型A中存在序列相关而模型B中却并不存在,则前者存在序列相关的原因何在? (c)这个例子告诉我们在自相关的检验中,d统计量有哪些优点? 5. 考虑如下回归模型: Yt??49.4664?0.88544X2t?0.09253X3t; R2=0.9979; d=0.875 5 t=(-2.2392) (70.2936) (2.693 3) 其中,Y=个人消费支出(1982年10亿美元) X2=个人可支配收入(1982年10亿美元)(PDl) X3=道·琼斯工业平均股票指数 根据1961—1985年期间美国数据。 (a)在回归的残差中存在一阶自相关吗?你是如何知道的? (b)利用杜宾两阶段过程,将上述回归转换成方程(12—15),结果如下: 2**Yt??17.97?0.89X2t?0.09X3t; R=0.9816; d=2.28 ?*t=(30.72) (2.66) 自相关的问题解决了吗?你是如何知道的? (c)比较初始回归和变换后的回归,PDI的t值急剧下降,这一变化表明了什么? (d)根据变换后模型获得的d值能否确定变换后的数据存在自相关? 6. 考虑下表所给数据: 年份 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 198l 1982 1983 1984 1985 1986 1987 美国股票价格指数和GNP数据 Y 45.72 54.22 60.29 57.42 43.84 45.73 54.46 53.69 53.70 58.32 68.10 74.02 68.93 92.63 92.63 108.09 136.00 161.70 X 1015.5 1 102.7 1212.8 1 359.3 l 472.8 1598.4 1782.8 1990.5 1 149.7 2508.2 2732.0 3052.6 3 166.0 3405.7 3772.2 4019.2 4240.3 4526.7 注:Y——NYSE复合普通股票价格指数(1965年12月31日=100) X——GNP(单位:10亿美元)。 数据来源:《总统经济报告,1989》,Y列数据来自第416页表B—94,X列数据来自第308页表B—1。 (a)估计OLS回归:Yt?B1?B2Xt??t (b)根据d统计量确定在数据中是否存在一阶自相关。 (c)如果存在,用d值来估计自相关系数。 (d)利用估计的? 对数数据变换,用OLS法估计广义差分方程: Yt??Yt?1?B1(1??)?B2(Xt??Xt?1)?vt (1)舍去第一个观察值; (2)包括第一个观察值。 (e)重复(b),但根据形如方程et??et?1?vt的残差中估计?值。利用估计的?值, 估计广义差分方程Yt??Yt?1?B1(1??)?B2(Xt??Xt?1)?vt (f)利用一阶差分法将模型变换成方程Yt?Yt?1?B2(Xt?Xt?1)?vt 或?Yt?B2?Xt的形式,并对变换后的模型进行估计。 比较(d)、(e)和(f)的回归结果。你能得出什么结论?在变换后模型中还存在自相关吗?你是如何知道的? 6.根据处理结果建立我国财政收入预测模型。其中FI财政收入、FE财政支出、GDP国内生产总值。要求:(1)指出设计预测模型的经济学依据;(2)指出预测模型在模型技术上的特点;(3)指出样本数据的起止时间;(4)通常时间序列存在自相关,该预测模型是否存在随机扰动项的自相关?为什么? ?第六章 多重共线性 一、单项选择题 1.在线性回归模型中,若解释变量X1和X2的观测值成比例,即有X1i?kX2i,其中k为非零常数,则表明模型中存在() A.方差非齐性 B.多重共线性 C.序列相关 D.设定误差 2.多重共线性是违背以下哪条假设( ) A E(μi)=0 B V(μi)= ζ2 C 所有自变量线性无关 D cov(μi, Xj)= 0 3.调整的判定系数A. 与多重判定系数 之间有如下关系( ) C. D. B. 4.在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在 ( ) A.多重共线性 B.异方差性 C.序列相关 D.高拟合优度 5.检测多重共线性的方法有 ( ) A.简单相关系数检测法 B.样本分段比较法 C.判定系数法 D.工具变量法 二、多项选择题 1.检测多重共线性的方法有 ( ) A.简单相关系数检测法 B.样本分段比较法 C.方差膨胀因子检测法 D.判定系数增量贡献法 E.工具变量法 2.当线性回归模型的解释变量之间存在较严重的多重共线性时,可使用的有偏估计方法有( ) A.工具变量法 B.加权最小二乘法 C.岭回归估计法 D.主成份回归估计法 E.间接最小二乘法 3.多重共线性的检验方法有( ) A.判定系数方法 B.逐步回归法 C.帕克检验法 D.逐步剔除法 E.GLS 4.克服多重共线的办法( ) A.差分法 B.改变样本容量 C.变换模型形式 D.岭回归估计 E.删除不必要的共线解释变量。 5.多重共线性指的是解释变量相互之间存在某种组合的或者某种程度的线性相关关系,多重共线存在的原因包括( ) A.经济变量之间的内在联系 B.从估计模型参数的方法上带来的 C.经济变量存在着同方向变动的趋势 D.将某些解释变量的滞后值作为解释变量引入了模型之中 E.世间事物本身固有的特性,它们之间是相互联系、相互制约的,但是只要不是完全的多重共线性,可以采取一些措施消除多重共线性 6.由于变量的误删,进行最小二乘法估计引起的后果有( ) A.估计量是有偏的 B.估计量的方差变小 C.估计量是无偏的 D.估计量的方差变大 三、填空题 1. 在存在接近多重共线性的情况下,回归系数的标准差会趋于 而t值会趋于 。 2. 在存在完全多重共线性的情况下,普通最小二乘估计量是 ,其方差 。 3. 在其他情况不变条件下,VIF越高,则普通最小二乘估计量的 越高。 四、判断题 1.尽管存在着完全多重共线性,普通最小二乘估计量仍然是最优线性无偏估计量(BLUE)。 2.在存在高度多重共线性的情况下,无法估计一个或多个偏回归系数的显著性。 3.如果辅助回归表明某一Ri2较高,则表明一定存在高度共线性。 4.较高的两两相关系数并不一定表明存在着高度多重共线性。 5.如果分析的目的仅仅是为了预测,则多重共线性并无妨碍。 五、简答题 1. 什么是多重共线性? 2. 完全和不完全多重共线性的区别是什么? 3. 在某物体重量对高度的回归模型中(一个高度用英尺度量,另一个高度用英寸度量),直观地解释 为什么普通最小二乘法无法估计该回归方程的系数? 4. 考虑模型: Yi?B1?B2Xi?B3Xi?B4Xi??i 其中,Y=生产的总成本,X=产出。“既然X2和X3是X的函数,则该模型中存在着多重共线性。”你认为对吗?为什么? 5.不完全多重共线性的理论后果是什么? 6.不完全多重共线性的实际后果是什么? 7.什么是方差膨胀系数(VIF)?根据下式,你能说出VIF的最小可能值和最大可能值吗? 23VIF? 9.非完全多重共线性可能产生的后果主要有哪些? 1 21-R28.怎样发现多重共线?至少举出两个克服多重共线的方法。 10.. 在用诸如失业、货币供给、利率、消费支出等经济时间序列数据进行回归分析时,常常怀疑存在多重共线性,为什么? 六、分析计算题 1.考虑下面模型: Yi?B1?B2Xt?B3Xt?1?B4Xt?2?B5Xt?3??t 其中,Y——消费 X——收入 t——时间 该模型表明:t时期的消费支出是该期收入以及前两期收入的线性函数。这类模型称为分布滞后模型(distributed lag models),也称为动态模型(dynamic models)(也就是说,模型涉及时间的变化)。 (a)你是否预期这类模型中存在多重共线性,为什么? (b)如果你怀疑存在多重共线性,那么如何“消除”它呢? 2.考虑如下数据集: Y 10 -8 6 4 2 0 2 4 6 8 10 X2 1 2 3 4 5 6 7 8 9 10 11 X3 1 3 5 7 9 11 13 15 17 19 21 假设你想做Y对X2和X3的多元回归, (a)你能估计模型的参数吗?为什么? (b)如果不能,你能够估计哪个参数或者参数的组合? 3.下表给出了美国1971—1986年期间的年数据。 Y X2 X3 年度 112.0 121.3 1971 10 227 111.0 125.3 1972 10 872 111.1 133.1 1973 11350 117.5 147.7 1974 8 775 127.6 161.2 1975 8 539 135.7 170.5 1976 9 994 142.9 181.5 1977 11 046 153.8 195.3 1978 11164 1979 10 559 166.0 217.7 1980 8 979 179.3 247.0 1981 8 535 190.2 272.3 1982 7 980 197.6 286.6 1983 9 179 202.6 297.4 1984 10 394 208.5 307.6 1985 11 039 215.2 318.5 1986 1l 450 224.4 323.4 X4 776.8 839.6 949.8 1 038.4 1 142.8 1 252.6 1 379.3 1 551.2 1 729.3 1 918.0 2 127.6 2 261.4 2 428.1 2 670.6 2 841.1 3 022.1 X5 4.89 4.55 7.38 8.61 6.16 5.22 5.50 7.78 10.25 11.28 13.73 11.20 8.69 9.65 7.75 6.31 X6 79 367 82 153 85 064 86 794 85 846 88 752 92 017 96 048 98 824 99 303 100 397 99 526 100 834 105 005 107 150 109 597 ①Y——售出新客车的数量/千辆,未作季度调整; ②X2——新车,消费者价格指数,1967二100,未作季度调整; ③X3——所有物品所有居民的消费者价格指数,1967=100,未作季度调整; ④X4——个人可支配收入(PDl)/10亿美元,未作季度调整; ⑤X5——利率,%,金融公司直接支付的票据利率; ⑥X6——城市就业劳动力/千人,未作季度调整; 数据来源:《商业统计》,1986年,《当代商业概览》增刊,美国商业部。 考虑下面的客车总需求函数: lnYt?B1?B2lnX2t?B3lnX3t?B4lnX4t?B5lnX5t?B6lnX6t??t 其中,1n表示自然对数 (a) 同时引入价格价格指数X2和X,的原因是什么? (b) 为什么在需求函数中引入“城市就业劳动力”? (c) 本模型中利率的作用是什么? (d) 你如何解释各部分斜率系数的经济意义? (e) 求上述模型的普通最小二估计值。 4.如果习题3中存在共线性问题,估计各辅助回归方程,并找出哪些变量是高度共线 性的。 5.R.Leighton Thomas在研究英国1961—1981年间砖、瓷、玻璃和水泥工业的生产函数时,得到如下结果: (1)logQ??5.04?0.887logK?0.893logH se=(1.40) (0.087) (0.137) 2 R=0.878 ?t?0.460logK?1.285logH (2)logQ??8.57?0.0272se= (2.99) (0.0204) (0.333) (0.324) R=0.889 其中,Q——固定成本的生产指数 K——1975年重置成本的总资本存量 H——工作的小时数 t——时间趋势,作为技术的一种测度方法 括号中的数字是估计的标准差。 (a)解释这两个回归方程。 (b)在回归方程1中验证在5%的显著水平下,部分斜率系数是统计显著的。 (c)在回归方程2中验证在5%的显著水平下,t和logK的系数各自均是统计不显著的。 (d)如何解释模型2中变量logK的不显著性? (e)如果得知t和K之间的相关系数为0.980,则你能够得出什么结论? (f)在模型2中即使t和K各自都是不显著的,你是接受还是拒绝假设:模型2中所有的部分斜率系数同时为零?你使用何种检验? (g)在模型1中,规模收益是什么? 2 第七章 虚拟变量和随机解释变量 一、单项选择题 1.由于引进虚拟变量,回归模型的截距或斜率随样本观测值的改变而系统地改变,这种模型称为 ( ) A.系统变参数模型 B.系统模型 C.变参数模型 D.分段线性回归模型 2.对于随机解释变量模型,模型参数的普通最小二乘法估计量是( ) A.无偏且一致的 B.无偏但不一致 C.有偏但一致 D.有偏且不一致 3.对于随机解释变量模型,估计模型参数应采用( ) A.普通最小二乘法 B.加权最小二乘法 C.广义差分法 D.工具变量法 4.虚拟变量( ) A.主要来代表质的因素,但在有些情况下可以用来代表数量因素 B.只能代表质的因素 C.只能代表数量因素 D.只能代表季节影响因素 5.分段线性回归模型的几何图形是( ) A.平行线 B.垂直线 C.光滑曲线 D.折线 6.如果一个回归模型中不包含截距项,对一个具有m个特征的质的因素要引入虚拟变量数目为( ) A.m B.m-1 C.m-2 D.m+1 7.假设回归模型为Yi??xi?Ui其中X为随机变量,X与U相关则?的普通最小二乘估计量( ) i i i A.无偏且一致 B.无偏但不一致 C.有偏但一致 D.有偏且不一致 8.在经济发展发生转折时期,可以通过引入虚拟变量方法来表示这种变化。例如,研究中国城镇居民消费函数时。1991年前后,城镇居民商品性实际支出Y对实际可支配收入X的回归关系明显不同。现以1991 ?1;正常年份Dt???0;反常年份,数据散点图显示消费函数发生了结构性变化:基本年为转折时期,设虚拟变量 消费部分下降了,边际消费倾向变大了。则城镇居民线性消费函数的理论方程可以写作:( )。 A、 Yt??0??1Xt?ut B、Yt??0??1Xt??2DtXt?ut Y????X??D?uY????X??D??DX?u01t2tt D、t01t2t3ttt C、t9.在经济发展发生转折时期,可以通过引入虚拟变量方法来表示这种变化。例如,研究中国城镇居民消费函数时。1991年前后,城镇居民商品性实际支出Y对实际可支配收入X的回归关系明显不同。现以1991 ?1;正常年份Dt???0;反常年份,数据散点图显示消费函数发生了结构性变化:基本年为转折时期,设虚拟变量 消费部分下降了,边际消费倾向变大了。则城镇居民线性消费函数的理论方程可以写作:( )。 A、 Yt??0??1Xt?ut B、Yt??0??1Xt??2DtXt?ut Y????X??D?uY????X??D??DX?u01t2tt D、t01t2t3ttt C、t10.随机解释变量是违背以下哪条假设( ) 2 A E(μi)=0 B V(μi)= ζ C 所有自变量线性无关 D cov(μi, Xj)= 0 ?y??11.某商品需求函数为ib0b1xiui,其中y为需求量,x为价格。为了考虑“地区”(农村、城市) 和“季节”(春、夏、秋、冬)两个因素的影响,拟引入虚拟变量,则应引入虚拟变量的个数为( )。 A.2 B.4 C.5 D.6 ?12.根据样本资料建立某消费函数如下:Ct?100.50?55.35Dt?0.45xt,其中C为消费,x为收入,虚1城镇家庭???D?0农村家庭?拟变量,所有参数均检验显著,则城镇家庭的消费函数为( )。 ????A.Ct?155.85?0.45xt B.Ct?100.50?0.45xt C.Ct?100.50?55.35xt D.Ct?100.95?55.35xt 13.假设某需求函数为 yi?b0?b1xi?ui,为了考虑“季节”因素(春、夏、秋、冬四个不同的状态), 引入4个虚拟变量形成截距变动模型,则模型的( )。 A.参数估计量将达到最大精度 B.参数估计量是有偏估计量 C.参数估计量是非一致估计量 D.参数将无法估计 14.对于模型 yi?b0?b1xi?ui,为了考虑“地区”因素(北方、南方),引入2个虚拟变量形成截距变 动模型,则会产生( )。 A.序列的完全相关 B.序列的不完全相关 C.完全多重共线性 D.不完全多重共线性 ?1城镇家庭?0农村家庭yi?a0?a1D?b0xi?b1D?xi?ui15.设消费函数为,其中虚拟变量D=?,当统计检验表明 下列哪项成立时,表示城镇家庭与农村家庭有一样的消费行为( )。 A.a1?0,b1?0 B.a1?0,b1?0 C.a1?0,b1?0 D.a1?0,b1?0 16.消费函数模型 yi?a0?a1D1i?a2D2i?a3D3i?bxi?ui,其中y为消费,x为收入, ?1第一季度?1第二季度?1第三季度D1??D2??D3???0其他季度,?0其他季度,?0其他季度,该模型中包含了几个质的影响因素( ) A.1 B.2 C.3 D.4 ?1北方D??y??D?bxi?ui?0南方 ,如果统计检验表明a0?1成立,17.设消费函数ia0a1,其中虚拟变量 则北方的消费函数与南方的消费函数是( )。 A.相互平行的 B.相互垂直的 C.相互交叉的 D.相互重叠的 18.假定月收入水平在1000元以内时,居民边际消费倾向维持在某一水平,当月收入水平达到或超过1000元时,边际消费倾向将明显下降,则描述消费(C)依收入(I)变动的线性关系宜采用( ) ?0Ct?a0?b1It?b2D?It?ut,D???1A. ?0Ct?a0?b1D?b2It?ut,D???1B. I?1000元I?1000元I?1000元I?1000元 **元 C.Ct?a0?b1(It?I)?ut,I?1000**D.Ct?a0?b1It?b2(It?I)D?ut, D、I同上 19.哪种情况下,模型的OLS估计量既不具备无偏性,也不具备一致性( )。 A.xt为非随机变量 B.xt为非随机变量 ,与ut不相关 C.xt为随机变量 ,但与ut不相关 D.xt为随机变量 ,与ut相关 20.模型中引入实际上与解释变量无关的变量,会导致参数OLS估计量( )。 A.增大 B.减小 C.有偏 D.非有效 21.如果模型包含有随机解释变量,且与随机误差项不独立也不线性相关,则普通最小二乘估计量和工具变量估计量都是( )。 A.无偏估计量 B.有效估计量 C.一致估计量 D.最佳线性无偏估计量 22.模型中引入一个无关的解释变量( )。 A.对模型参数估计量的性质不产生任何影响 B.导致普通最小二乘估计量有偏 C.导致普通最小二乘估计量精度下降 D.导致普通最小二乘估计量有偏,同时精度下降 二、多项选择题 1.关于虚拟变量,下列表述正确的有 ( ) A.是质的因素的数量化 B.取值为l和0 C.在有些情况下可代表数量因素 D.代表数量因素 E.代表质的因素 2.在包含有随机解释变量的回归模型中,可用作随机解释变量的工具变量必须具备的条件有,此工具变量( ) A.与该解释变量高度相关 B.与其它解释变量高度相关 C.与随机误差项不相关 D.与该解释变量不相关 3.关于虚拟变量,下列表述正确的有 ( ) A.是质的因素的数量化 B.取值为l和0 C.代表质的因素 D.在有些情况下可代表数量因素 E.代表数量因素 4.在包含有随机解释变量的回归模型中,可用作随机解释变量的工具变量必须具备的条件有,此工具变量( ) 三、填空题 A.与该解释变量高度相关 B.与其它解释变量高度相关 C.与随机误差项高度相关 D.该解释变量不相关 E.与随机误差项不相关 5.在模型中引入虚拟变量的作用( ) A.分离异常因素的影响(例如剔除文革时期) B.检验不同属性类型对因变量的影响(例如工资模型中反映性别) C.反映季节变动 D.提高模型的精度(把不同类型的样本合在一起,增大了n) E.构造抉择模型 6.关于虚拟变量,下列表述正确的有 ( ) A.是质的因素的数量化 B.取值为l和0 C.代表数量因素 D.在有些情况下可代表数量因素 1.样本观察值与回归方程理论值之间的偏差,称为 ,我们用 估计线性回归模型中的 。 2.虚拟变量在模型中,可以作 ,也可以作 。虚拟变量作解释变量引入模型的基本方式: ; 指的是虚拟变量D与其它解释变量在模型中是相加关系,通常用以表示 ; 指的是在模型中虚拟变量D与其它解释变量呈乘积关系,通常用以表示 。 3.在经济发展发生转折时期,可以通过建立临界指标虚拟变量模型来表示。例如,进口消费品的数量Y主要取决于国民收入X的多少。1979年前后,Y对X的回归关系明显不同。现以t=1979年为转折时期,1979年国民收入Xt为临界值,设虚拟变量Dt(t>=1979,Dt=1;Dt<1979,Dt=0)。进口消费品模型为 Yt=b0+b1Xt+b2(Xt-Xt)Dt+ut 当t 4.对于随机扰动项我们作了6项假定。 ,根据高斯马尔科夫定理,由最小二乘法得到的参数估计量具有 。为了进行区间估计我们又对随机扰动项作了它服从 。如果不满足6项假定之一,就不具有BLUE。 5. 的基本思路是,利用适当的工具变量去替代结构方程中作为解释变量的内生变量,以减少解释变量与随机扰动项的 ,从而可以用OLS法进行参数估计。 6.Koyck方法是将 模型转换为 ,然后进行估计。 7.行为方程式是解释市场主体棗企业、居民和政府 的,它描述这些主体对外部环境如何作出反映。行为关系是建立在 基础之上的。 8. 是解释生产要素投入与产出之间的工艺性配置的。 四、判断题 1.选择的工具变量与随机扰动项相关 2.选择的工具变量与(随机扰动项)不相关 3. 选择的工具变量与所替代的解释变量高度相关 4. 对包含常数项的季节变量模型运用最小二乘法时,如果模型中需要引入季节虚拟变量时,一般引入虚拟变量的个数为4。 ** * * * 5.在模型Yi?B0?B1Xi?B2Di??中,令Di取值(0,2)而不是(0,1),那么B2的值将二等分,t值也将二等分。 6.将样本资料按一定的变化规律分成不同阶段,引进虚拟变量进行回归,得到不同阶段的回归方程。 7.由于引进虚拟变量造成回归模型参数不再是固定常数。若截距项发生变动,就称为截距变动模型。 五、简答题 1.为什么要在线性回归模型中引入虚拟变量?怎样定义虚拟变量? 2.回归模型中引入虚拟变量的一般原则是什么? 3.在模型中引入多个虚拟变量时,虚拟变量的个数应按下列原则确定:如果有(M)个互斥的属性类型,则在模型中引入(M-1)个虚拟变量。 4.什么是虚拟变量? 5.根据虚拟变量在线性回归模型中的作用,对虚拟变量的分类有那些? 6.虚拟变量作解释变量引入模型的基本方式有几种?并简述其关系。 7.在经济发展发生转折时期,可以通过建立临界指标虚拟变量模型来表示。例如,进口消费品的数量Y主要取决于国民收入X的多少。1979年前后,Y对X的回归关系明显不同。现以t=1979年为转折时期,1979年国民收入Xt为临界值,设虚拟变量Dt(t>=1979,Dt=1;Dt<1979,Dt=0)。请写出进口消费品模型 8.简述凯恩斯的有效需求理论的基本结论。 9.在估计下面的模型中,你预见会出现什么问题? (a)Yt?B0?B1D1t?B2D2t?B3D3t?B4D4t??t 其中:Dit??* * i?1,2,3,4?1,第i季的观察值,?0,其他(b)GNPt?B1?B2Mt?B3Mt-1?B4(Mt?Mt-1)??t 其中,GNPt=第t期国民生产总值 Mt=第t期的货币供给 Mt-1=第t-1期的货币供给 10.如果现在有月度数据,在对下面的假设进行检验时,你将引入几个虚拟变量? (a)一年中的每月均呈现季节波动趋势。 (b)只有2月、4月、6月、8月、10月、12月呈现季节波动的趋势。 11什么是虚拟变量?它在模型中有什么作用? 12.引入虚拟解释变量的两种基本方式是什么?它们各适用于什么情况? 13.利用月度数据资料,为了检验下面的假设,应引入多少个虚拟解释变量? ① 一年里的12个月全部表现出季节模式; ② 只有2月、6月、8月、10月、12月表现出季节模式。 六、分析计算题 1.考虑下面的模型: Yi?B0?B1Xi?B2Di?B3D3i??i 其中,Y——MPA毕业年收入 X——工龄 ?1,哈佛MBA?1,沃顿MBAD2??D? 3? 0,其他0,其他??(a) 你预期各系数的符号如何? (b) 如何解释B2、B3? (c) 若B2〉B3,你得出什么结论? 2.继续上题,但现考虑下面模型: Yi?B0?B1Xi?B2D2i?B3D3i?B(?B(??i 4D2iXi)5D3iXi)(a) 这个模型与习题6的模型有什么区别? (b) 如何解释截距B4、B5? (c) 若B4、B5各自均是统计显著的,你将选择这个模型还是习题6的模型?如果不是,你会犯哪类 错误? (d) 如何检验假设:B4=B5=0(选作题,参见有限的OLS法) 3.为了解美国工作妇女是否受到歧视,可以用美国统计局的“当前人口调查”中的截面数据,研究男女工资有没有差别。这项多元回归分析研究所用到的变量有: W——雇员的工资率(美元/小时)?1若雇员为妇女SEX???0其他ED——受教育的年数AGE——年龄 对124名雇员的样本进行的研究得到回归结果为:(括号内为估计的t值) W??6.41?2.76SEX?0.99ED?0.12AGE(?3.38)(?4.61)(8.54)(4.63)R2?0.867F?23.2求:(1)该模型调整后的决定系数R; (2)各估计值的标准差为多少? (3)检验美国工作妇女是否受到歧视,为什么? (4)按此模型预测一个30岁受教育16年的美国男性的平均每小时的工作收入为多少美元? 2? t(124)=1.656,t0.05(120)=1.658)t0.025(124)=1.97,t0.025(120)=1.98, (显著性水平??0.05,0.05 4.H.C.Huang,J.J.Siegfried和F.Zardonshty根据美国1961年第一季度至1977年第二季度的数据估计了对咖啡的需求函数如下(括号内的数字为t值): ?lnQ?1.2789?0.1647lnPt?0.5155lnIt?0.1483lnPt' t= (-2.14) (1.23) (0.55) ?0.0089T?0.0961D1t?0.1570D2t?0.0097D3t t= (-3.36) (-3.74) (-6.03) (-0.37) 式中,Q——(按人口)平均消费咖啡量 P——每磅咖啡的相对价格(以1967年为不变价) I——(按人口)平均PDI,单位为美元(以1967年为不变价) P——每磅茶的相对价格(以1967年为不变价) T——时间趋势,T=1(1961年第一季度)至T=66(1977年第二季度) D1——1,第一季度 D2——1,第二季度 D3——1,第三季度 ln——自然对数 (a) 如何解释P,I,P的系数? '' 百度搜索“70edu”或“70教育网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,70教育网,提供经典综合文库计量经济学习题集在线全文阅读。
相关推荐: