个回归直线方程公式中两个变量是否有内生性


计量经济学全部答案(庞浩) 计量经济学全部答案(庞浩)第二版 第二章练习题及 第二章练习题及参考解答
2.1 为研究中国的货币供应量(以货币与准货币 M2 表示)与国内生产总值(GDP)的相互 依存关系,分析表中 1990 年―2007 年中国货币供应量(M2)和国内生产总值(GDP)的有 关数据: 表 2.9 1990 年―2007 年中国货币供应量和国内生产总值(单位:亿元) 年份 货币供应量 M2 国内生产总值 GDP

资料来源:中国统计年鉴 2008,中国统计出版社

对货币供应量与国内生产总值作相关分析,并说明相关分析结果的经济意义。 参考解答: 练习题 2.1 参考解答: 计算中国货币供应量(以货币与准货币 M2 表示)与国内生产总值(GDP)的相关系数为: 计算方法:

绘制美国软饮料公司广告费用与销售数量的相关图, 并计算相关系数,分析其相关程 度。能否在此基础上建立回归模型作回归分析? 练习题 2.2 参考解答 美国软饮料公司的广告费用 X 与销售数量 Y 的散点图为

说明美国软饮料公司的广告费用 X 与销售数量 Y 正线性相关。 相关系数为:

说明美国软饮料公司的广告费用 X 与销售数量 Y 的正相关程度相当高。 若以销售数量 Y 为被解释变量,以广告费用 X 为解释变量,可建立线性回归模型


利用 EViews 估计其参数结果为

经 t 检验表明, 广告费用 X 对美国软饮料公司的销售数量 Y 确有显著影响。回归结果表明, 广告费用 X 每增加 1 百万美元, 平均说来软饮料公司的销售数量将增加 14.40359(百万箱)。 2.3 为了研究深圳市地方预算内财政收入与国内生产总值的关系,得到以下数据: 表 2.11 年 份 深圳市地方预算内财政收入与国内生产总值 地方预算内财政收入 Y (亿元) 21.70

资料来源: 深圳市统计年鉴 2008. 中国统计出版社

(1)建立深圳地方预算内财政收入对本市生产总值 GDP 的回归模型; (2)估计所建立模型的参数,解释斜率系数的经济意义; (3)对回归结果进行检验。 (4)若是 2008 年深圳市的本市生产总值为 8000 亿元,试对 2008 年深圳市的财政收入 作出点预测和区间预测 ( α = 0.05 )。 参考解答: 练习题 2.3 参考解答 1、 建立深圳地方预算内财政收入对 GDP 的回归模型,建立 EViews 文件,利用地 方预算内财政收入(Y)和 GDP 的数据表,作散点图

可看出地方预算内财政收入(Y)和 GDP 的关系近似直线关系,可建立线性回归模型:


利用 EViews 估计其参数结果为

经检验说明,深圳市的 GDP 对地方财政收入确有显著影响。 R = 0.9771 ,说明 GDP 解释

了地方财政收入变动的近 98%,模型拟合程度较好。 模型说明当 GDP 每增长 1 亿元时,平均说来地方财政收入将增长 0.0850 亿元。 当 2008 年 GDP 为 7500 亿元时,地方财政收入的点预测值为:

Y f 个别值置信度 95%的预测区间为:

2.4 为研究中国改革开放以来国民总收入与最终消费的关系,搜集到以下数据:

(单位:亿元) 国民总收入 X 最终消费 Y

资料来源:中国统计年鉴 2008. 中国统计出版社,2008.

(1) 以分析国民总收入对消费的推动作用为目的,建立线性回归方程,并估计其参数。

? (2) 计算回归估计的标准误差 σ 和可决系数 R 2 。


(3) 对回归系数进行显著性水平为 5%的显著性检验。 (4) 如果 2008 年全年国民总收入为 300670 亿元,比上年增长 9.0%,预测可能达到的最终 消费水平,并对最终消费的均值给出置信度为 95%的预测区间。 参考解答: 练习题 2.4 参考解答: (1)以最终消费为被解释变量 Y,以国民总收入为解释变量 X,建立线性回归模型:
利用 EViews 估计参数并检验

? (2)回归估计的标准误差即估计的随机扰动项的标准误差 σ =


对最终消费的均值置信度为 95%的预测区间为:

由 Eviews 计算国民总收入 X 变量样本数据的统计量得:

美国各航空公司业绩的统计数据公布在 《华尔街日报 1999 年年鉴》 The Wall Street (

Journal Almanac 1999)上。航班正点到达的比率和每 10 万名乘客投诉的次数的数据如下1。

(1)画出这些数据的散点图 (2)根据散点图。表明二变量之间存在什么关系? (3)估计描述投诉率如何依赖航班按时到达正点率的回归方程。 (4)对估计的回归方程斜率的意义作出解释。 (5)如果航班按时到达的正点率为 80%,估计每 10 万名乘客投诉的次数是多少? 参考解答: 练习题 2.5 参考解答: 美国各航空公司航班正点到达比率 X 和每 10 万名乘客投诉次数 Y 的散点图为

由图形看出航班正点到达比率和每 10 万名乘客投诉次数呈现负相关关系, 利用 EViews 计算线性相关系数为: X Y

建立描述投诉率(Y)依赖航班按时到达正点率(X)的回归方程:


利用 EViews 估计其参数结果为

(1.017832) (-0.014176) t=(5.718961) (-4.967254) R2=0.778996 F=24.67361 从检验结果可以看出, 航班正点到达比率对乘客投诉次数确有显著影响。 这说明当航班正点到达比率每提 1 个百分点, 平均说来每 10 万名乘客投诉次数将下降 0.07 次。 如果航班按时到达的正点率为 80%,估计每 10 万名乘客投诉的次数为

2.6 表 2.34 中是 16 支公益股票某年的每股帐面价值 Y 和当年红利 X 的数据: 表 2.14

某年 16 支公益股票每股帐面价值和当年红利

(1)分析每股帐面价值和当年红利的相关性? (2) 建立每股帐面价值和当年红利的回归方程; (3)解释回归系数的经济意义。 参考解答: 练习题 2.6 参考解答: 1.分析每股帐面价值和当年红利的相关性 作散布图:

从图形看似乎具有一定正相关性,计算相关系数:

每股帐面价值和当年红利的相关系数为 0..建立每股帐面价值 X 和当年红利 Y 的回归方程:

2.7 设销售收入 X 为解释变量,销售成本 Y 为被解释变量。现已根据某百货公司某年 12 个月的有关资料计算出以下数据: (单位:万元)

(1) 拟合简单线性回归方程,并对方程中回归系数的经济意义作出解释。 (2) 计算可决系数和回归估计的标准误差。 (3) 对 β 2 进行显著水平为 5%的显著性检验。 (4) 假定下年 1 月销售收入为 800 万元,利用拟合的回归方程预测其销售成本,并给出 置信度为 95%的预测区间。

参考解答: 练习题 2.7 参考解答: (1)建立回归模型: Yi =

说明该百货公司销售收入每增加 1 元,平均说来销售成本将增加 0.7863 元。 (2)计算可决系数和回归估计的标准误差 可决系数为:

? 回归估计的标准误差: σ =

(3) 对 β 2 进行显著水平为 5%的显著性检验

表明 β 2 显著不为 0,销售收入对销售成本有显著影响. (4) 假定下年 1 月销售收入为 800 万元,利用拟合的回归方程预测其销售成本,并给出置 信度为 95%的预测区间。

资料来源:联合国发展规划署. 人的发展报告. 1993

(1)分别设定简单线性回归模型,分析各国人均寿命与人均 GDP、成人识字率、一岁儿 童疫苗接种率的数量关系。

(2)对所建立的多个回归模型进行检验。 (3)分析对比各个简单线性回归模型。

参考解答: 练习题 2.8 参考解答: (1) 分别设定简单线性回归模型,分析各国人均寿命与人均 GDP、成人识字率、一岁 儿童疫苗接种率的数量关系: 1) 人均寿命与人均 GDP 关系

人均寿命与成人识字率关系

人均寿命与一岁儿童疫苗接种率关系

(2)对所建立的多个回归模型进行检验 由人均 GDP、 成人识字率、 一岁儿童疫苗接种率分别对人均寿命回归结果的参数 t 检验 值均明确大于其临界值,而且从对应的 P 值看,均小于 0.05,所以人均 GDP、成人识字率、一 岁儿童疫苗接种率分别对人均寿命都有显著影响. (3)分析对比各个简单线性回归模型 人均寿命与人均 GDP 回归的可决系数为 0.5261 人均寿命与成人识字率回归的可决系数为 0.7168 人均寿命与一岁儿童疫苗接种率的可决系数为 0.5379 相对说来,人均寿命由成人识字率作出解释的比重更大一些

按照“弗里德曼的持久收入假说”: 持久消费 Y 正比于持久收入 X ,依此假说

建立的计量模型没有截距项,设定的模型应该为:Yi = β 2 X i + ui ,这是一个过原点的回归。

? 在古典假定满足时,证明过原点的回归中 β 2 的 OLS 估计量 β 2 的计算公式是什么?对该模

= 0 和 ∑ ei X i = 0 ?对比有截距项模型和无截距项模型参数的 OLS 估计

参考解答: 练习题 2.9 参考解答: 没有截距项的过原点回归模型为: Yi = β 2 X i + u 因为

? 而有截距项的回归为 β 2 =

对于过原点的回归,由 OLS 原则:

还可以证明对于过原点的回归

2.10 练习题 2.3 中如果将“地方财政收入”和“本市生产总值”数据的计量单位分别或 同时由”亿元”改为”万元”,重新估计参数,对比参数估计及检验结果与计量单位更改之前有 什么区别? 你能从中总结出什么规律性吗?

参考解答: 练习题 2.10 参考解答: 如果将“地方财政收入 Y”和“本市生产总值 GDP” 数据的计量单位分别或同时由”亿元”改为” 万元”,数据变为: 深圳市地方预算内财政收入与国内生产总值 年 份 地方预算内财政收入 Y (亿元)Y1 92 95 98 01 .70

A.当“地方财政收入”和“本市生产总值”数据的计量单位均为“亿元”时估计检验结果 为:


(98674.40) (0.0032549) t=(2.073593) (26.10376) R2=0.977058 可以总结出,变量度量单位对回归影响的一般规律为: 1)当被解释变量测量单位改变 (扩大或缩小常数 c 倍) ,而解释变量测量单位不变时:OLS 截距和斜率的估计值及标准误差都缩小或扩大为原来的 c 倍. (如 C 的情况)

2)当解释变量测量单位改变 (扩大或缩小常数 c 倍) ,而被解释变量测量单位不变时:OLS 斜率的估计值及标准误差扩大或缩小为原来的 c 倍,但不影响截距的估计. (如 B 的情况)3) 当被解释变量和解释变量测量单位同时改变相同倍数时,OLS 的截距估计值及标准误差扩大 为原来的 c 倍,但不影响斜率的估计. (如 D 的情况)

4)当被解释变量和解释变量测量单位改变时,不会影响拟合优度.可决系数是纯数没有 维度,所以不随计量单位而变化。


3.1 为研究中国各地区入境旅游状况,建立了各省市旅游外汇收入(Y,百万美元) 、旅 行社职工人数(X1,人) 、国际旅游人数(X2,万人次)的模型,用某年 31 个省市的截面 数据估计结果如下:

(1) 从经济意义上考察估计模型的合理性。 (2) 在 5%显著性水平上,分别检验参数 β 1 , β 2 的显著性。 (3) 在 5%显著性水平上,检验模型的整体显著性。 3.2 根据下列数据试估计偏回归系数、标准误差,以及可决系数与修正的可决系数:

(1) 建立家庭书刊消费的计量经济模型;

(2)利用样本数据估计模型的参数; (3)检验户主受教育年数对家庭书刊消费是否有显著影响; (4)分析所估计模型的经济意义和作用 3.4 考虑以下“期望扩充菲利普斯曲线(Expectations-augmented Phillips curve) ”模型:

实际通货膨胀率 Y (%)

(1)对此模型作估计,并作出经济学和计量经济学的说明。 (2)根据此模型所估计结果,作计量经济学的检验。 (3)计算修正的可决系数(写出详细计算过程) 。

3.5 某地区城镇居民人均全年耐用消费品支出、人均年可支配收入及耐用消费品价格指 数的统计资料如表所示: 年份 人均耐用消费品支出 Y(元) 人均年可支配收入 X1(元) 耐用消费品价格指数 X2(1990 年=100)

利用表中数据, 建立该地区城镇居民人均全年耐用消费品支出关于人均年可支配收入和 耐用消费品价格指数的回归模型,进行回归分析,并检验人均年可支配收入及耐用消费品 价格指数对城镇居民人均全年耐用消费品支出是否有显著影响。 3.6 下表给出的是 1960―1982 年间 7 个 OECD 国家的能源需求指数 (Y) 、实际 GDP 指 数(X1) 、能源价格指数(X2)的数据,所有指数均以

归系数是否显著。 (2) 再 建 立 能 源 需 求 与 收 入 和 价 格 之 间 的 线 性 回 归 模 型


否显著。 (3 )比较所建立的两个模型,如果两个模型结论不同,你将选择哪个模型,为什么?
练习题 3.1 参考解答 有模型估计结果可看出: 旅行社职工人数和国际旅游人数均与旅游外汇收入正相关。 平 均说来,旅行社职工人数增加 1 人,旅游外汇收入将增加 0.1179 百万美元;国际旅游人数 增加 1 万人次,旅游外汇收入增加 1.5452 百万美元。 取 α = 0.05 ,查表得 t 0.025 (31 ? 3) = 2.048 因为 3 个参数 t 统计量的绝对值均大于 t 线性回归方程显著 成立。 练习题 3.3 参考解答 (1)建立家庭书刊消费的计量经济模型:
其中:Y 为家庭书刊年消费支出、X 为家庭月平均收入、T 为户主受教育年数 (2)估计模型参数,结果为

(3) 检验户主受教育年数对家庭书刊消费是否有显著影响: 由估计检验结果, 户主受教育年数参数对应的 t 统计量为 10.06702, 明显大于 t 的临界值

α = 0.05 ,均可判断户主受教育年数对家庭书刊消费支出确实有显著影响。


(4)本模型说明家庭月平均收入和户主受教育年数对家庭书刊消费支出有显著影响,家庭 月平均收入增加 1 元,家庭书刊年消费支出将增加 0.086 元,户主受教育年数增加 1 年,家 庭书刊年消费支出将增加 52.37 元。 练习题 3.5 参考解答 (1) 建立该地区城镇居民人均全年耐用消费品支出关于人均年可支配收入和耐用消费 品价格指数的回归模型:

由估计和检验结果可看出,该地区人均年可支配收入的参数的 t 检验值为 10.54786,其 绝对值大于临界值 t 0.025 (11 ? 3) = 2.306 ; 而且对应的 P 值为 0.0000, 也明显小于 α = 0.05 。 说明人均年可支配收入对该地区城镇居民人均全年耐用消费品支出确实有显著影响。 但是,该地区耐用消费品价格指数的参数的 t 检验值为-0.921316,其绝对值小于临界值


用消费品价格指数对城镇居民人均全年耐用消费品支出并没有显著影响。

是有人建议你进行如下回归:


? ? ? (2) β1会等于α1或γ 1或两者的某个线性组合吗?
参考解答: 练习题 4.1 参考解答:

当 X 2 与X 3 之间的相关系数为零时,离差形式的

4.2 在决定一个回归模型的“最优”解释变量集时人们常用逐步回归的方法。在逐步回 归中既可采取每次引进一个解释变量的程序(逐步向前回归),也可以先把所有可能的解释变 量都放在一个多元回归中,然后逐一地将它们剔除(逐步向后回归)。加进或剔除一个变量, 通常是根据 F 检验看其对 ESS 的贡献而作出决定的。根据你现在对多重共线性的认识,你 赞成任何一种逐步回归的程序吗?为什么?

参考解答: 练习题 4.2 参考解答: 根据对多重共线性的理解, 逐步向前和逐步向后回归的程序都存在不足。 逐步向前法不 能反映引进新的解释变量后的变化情况, 即一旦引入就保留在方程中; 逐步向后法则一旦某 个解释变量被剔出就再也没有机会重新进入方程。 而解释变量之间及其与被解释变量的相关 关系与引入的变量个数及同时引入哪些变量而呈现出不同, 所以要寻找到“最优”变量子集则 采用逐步回归较好,它吸收了逐步向前和逐步向后的优点。

4.3 下表给出了中国商品进口额 Y、国内生产总值 GDP、居民消费价格指数 CPI。 表 4.11 中国商品进口额、国内生产总值、居民消费价格指数

国内生产总值 (亿元)

居民消费价格指数(0.0

资料来源:《中国统计年鉴》,中国统计出版社 2000 年、2008 年。


根据这些回归你能对数据中多重共线性的性质说些什么?

? ? 4)假设数据有多重共线性,但 β 2 和β 3 在 5%水平上个别地显著,并且总的 F 检验也是显


著的。对这样的情形,我们是否应考虑共线性的问题?

参考解答 练习题 4.3 参考解答: (1) 参数估计结果如下

(括号内为标准误) (2)居民消费价格指数的回归系数的符号不能进行合理的经济意义解释,且且 CPI 与进口之 间的简单相关系数呈现正向变动。可能数据中有多重共线性。 计算相关系数:

(3)最大的 CI=108.812,表明 GDP 与 CPI 之间存在较高的线性相关。 (4)分别拟合的回归模型如下:


单方程拟合效果都很好,回归系数显著,可决系数较高,GDP 和 CPI 对进口分别有显著 的单一影响, 在这两个变量同时引入模型时影响方向发生了改变, 这只有通过相关系数的分 析才能发现。 (5)如果仅仅是作预测,可以不在意这种多重共线性,但如果是进行结构分析,还是应该引 起注意。 4.4 自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造解释变量数据 矩阵 X 才可能避免多重共线性的出现?

参考解答: 练习题 4.4 参考解答: 本题很灵活,主要应注意以下问题:

(1)选择变量时要有理论支持,即理论预期或假设;变量的数据要足够长,被解释变量与 解释变量之间要有因果关系,并高度相关。 (2)建模时尽量使解释变量之间不高度相关,或解释变量的线性组合不高度相关。

4.5 克莱因与戈德伯格曾用 年( 年战争期间略去)美国国内消费 Y 和 工资收入 X1、非工资―非农业收入 X2、农业收入 X3 的时间序列资料,利用 OLSE 估计得 出了下列回归方程:


括号中的数据为相应参数估计量的标准误差。试对上述模型进行评析,指出其中存在的问 题。 参考解答: 练习题 4.5 参考解答: 从模型拟合结果可知,样本观测个数为 27,消费模型的判定系数 R = 0.95 ,F 统计量为

107.37,在 0.05 置信水平下查分子自由度为 3,分母自由度为 23 的 F 临界值为 3.028,计算 的 F 值远大于临界值,表明回归方程是显著的。模型整体拟合程度较高。 依据参数估计量及其标准误,可计算出各回归系数估计量的 t 统计量值:

除 t1 外,其余的 t j 值都很小。工资收入 X1 的系数的 t 检验值虽然显著,但该系数的估计值 过大,该值为工资收入对消费边际效应,因为它为 1.059,意味着工资收入每增加一美元, 消费支出的增长平均将超过一美元,这与经济理论和常识不符。 另外,理论上非工资―非农业收入与农业收入也是消费行为的重要解释变量,但两者的 t 检验都没有通过。这些迹象表明,模型中存在严重的多重共线性,不同收入部分之间的相互 关系,掩盖了各个部分对解释消费行为的单独影响。

4.6 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发 展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费总量 Y (万吨标 准煤)、国民总收入(亿元)X1(代表收入水平)、国内生产总值 (亿元)X2(代表经济发展水平)、 工业增加值(亿元)X3、 建筑业增加值(亿元)X4、 交通运输邮电业增加值(亿元)X5(代表产业发

展水平及产业结构)、人均生活电力消费 (千瓦小时)X6(代表人民生活水平提高)、能源加工 转换效率(%)X7(代表能源转换技术)等在 年期间的统计数据,具体如表 4.2 所示。 表 4.12 年份 能源消费 y 87 90 93 96 99 2000

资料来源: 《中国统计年鉴》 ,中国统计出版社 2000、2008 年版。

要求: 1)建立对数多元线性回归模型,分析回归结果。 2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么? 3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。

作全部变量对数线性多元回归,结果为:

从修正的可决系数和 F 统计量可以看出, 全部变量对数线性多元回归整体对样本拟合很好, , 各变量联合起来对能源消费影响显著。可是其中的 lnX3、lnX4、lnX6 对 lnY 影响不显著, 而且 lnX2、lnX5 的参数为负值,在经济意义上不合理。所以这样的回归结果并不理想。 (2) 预料此回归模型会遇到多重共线性问题, 因为国民总收入与 GDP 本来就是一对关 联指标;而工业增加值、建筑业增加值、交通运输邮电业增加值则是 GDP 的组成部分。这 两组指标必定存在高度相关。 解释变量国民总收入(亿元)X1(代表收入水平)、 国内生产总值(亿元)X2(代表经济发展水 平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表 产业发展水平及产业结构)、人均生活电力消费 (千瓦小时)X6(代表人民生活水平提高)、能 源加工转换效率(%)X7(代表能源转换技术)等很可能线性相关,计算相关系数如下:

可以看出 lnx1 与 lnx2、 lnx3、 lnx4、 lnx5、 lnx6 之间高度相关, 许多相关系数高于 0.900 以上。如果决定用表中全部变量作为解释变量,很可能会出现严重多重共线性问题。 (3)因为存在多重共线性,解决方法如下: A:修正理论假设,在高度相关的变量中选择相关程度最高的变量进行回归建立模型: 而对变量取对数后, 能源消费总量的对数与人均生活电力消费的对数相关程度最高, 可建立

这两者之间的回归模型。如

B:进行逐步回归,直至模型符合需要研究的问题,具有实际的经济意义和统计意义。 采 用 逐 步 回 归 的 办 法 , 去 检 验 和 解 决 多 重 共 线 性 问 题 。 分 别 作 ln Y 对


参数估计值 t 统计量 可决系数 调整可决系 数

其中加入 lnX6 的方程调整的可决系数最大, 以 lnX6 为基础, 顺次加入其他变量逐步回归。 结果如下表:

经比较,新加入 lnX5 的方程调整可决系数改进最大, 各参数的 t 检验也都显著,但是 lnX5 参数


的符号与经济意义不符合。若再加入其他变量后的逐步回归,若剔除不显著的变量和无经济意义 的变量后, 仍为第一步所建只包含 lnX6 的一元回归模型。 如果需要建立多元线性回归模型,则需寻找新的变量或改变模型形式。 例如, 不取对数作全部变量多元线性回归,结果为:

可以看出还是有严重多重共线性。作逐步回归: 分别作一元回归得到: 变量


参数估计值 t 统计量

以 X1 为基础加入其他变量, 结果为:

注: 括号中为 p 值. 可以发现加入 X2、X5、X6、X7 后参数的符号不合理,加入 X4 后并不显著。只有加入 X3 后修正的可决系数有所提高,而且参数符号的经济意义合理, X3 参数估计值的 p 值为 0.0821, 在 10%的显著性水平下是显著的。所以相对较为合理的模型估计结果可以为:

4.7 在本章开始的“引子”提出的“农业的发展反而会减少财政收入吗?”的例子中,如果 所采用的数据如下表所示 表 4.13 年财政收入及其影响因素数据 建筑业增加 受灾面积 财政收入 农业增加值 工业增加值 总人口(万 最终消费 年份 值(亿 (千公 (亿元)CS (亿元)NZ (亿元)GZ 人)TPOP (亿元)CUM 元)JZZ 顷)SZM


(资料来源: 《中国统计年鉴 2008》 ,中国统计出版社 2008 年版)

试分析:为什么会出现本章开始时所得到的异常结果?怎样解决所出现的问题? 参考解答: 练习题 4.7 参考解答 (1)根据样本数据得到各解释变量的样本相关系数矩阵如下: 样本相关系数矩阵

解释变量之间相关系数较高,特别是农业增加值、工业增加值、建筑业增加值、最终消费之 间,相关系数都在 0.9 以上。这显然与第三章对模型的无多重共线性假定不符合。 (2)解决方案: 采用逐步回归的方式,可以得到没有共线性的回归模型,但可能存在设定偏误。 合并工业增加值与建筑业增加值,得到财政收入与第二产业的回归。 取对数再回归,可以减低共线性。

(1)选用适当的变换修正异方差,要求写出变换过程; (2)写出修正异方差后的参数估计量的表达式。 参考解答: 练习题 5.1 参考解答: (1)因为 f ( X i ) = X 2i ,所以取 W2 i =


上述模型的随机误差项的方差为一固定常数,即

(2)根据加权最小二乘法,可得修正异方差后的参数估计式为

参考解答: 练习题 5.2 参考解答: (1)该模型样本回归估计式的书写形式为


(2)首先,用 Goldfeld-Quandt 法进行检验。 将样本 X 按递增顺序排序,去掉中间 1/4 的样本,再分为两个部分的样本,即
分别对两个部分的样本求最小二乘估计,得到两个部分的残差平方和,即

给定 α = 0.05 ,在自由度为 2 下查卡方分布表,得 χ 2 = 5.9915 。比较临界值与卡方

χ 2 = 5.9915 ,同样说明模型中的随机误差项存在异方差。

1 ,作加权最小二乘估计,得如下结果 X

用 White 法进行检验得如下结果:

给定 α = 0.05 ,在自由度为 2 下查卡方分布表,得 χ 2 = 5.9915 。比较临界值与卡方 统计量值,即 nR 2 = 5.951910<χ 2 = 5.9915 ,说明加权后的模型中的随机误差项不存在异 方差。其估计的书写形式为

下表是 2007 年我国各地区农村居民家庭人均纯收入与家庭人均生活消费支出的数


地 北 天 河 山 区 京 津 北 西

各地区农村居民家庭人均纯收入与家庭人均生活消费支出的数据(单位:元)

内蒙古 辽 吉 宁 林

黑龙江 上 江 浙 安 福 江 山 河 海 苏 江 徽 建 西 东 南

(1) 试根据上述数据建立 2007 年我国农村居民家庭人均消费支出对人均纯收入的线性 回归模型。 (2)选用适当方法检验模型是否在异方差,并说明存在异方差的理由。 (3)如果存在异方差,用适当方法加以修正。 参考解答: 练习题 5.3 参考解答: 解: (1)建立样本回归函数。

(2)利用 White 方法检验异方差,则 White 检验结果见下表:

由上述结果可知,该模型存在异方差。分析该模型存在异方差的理由是,从数据可以看出, 一是截面数据; 二是各省市经济发展不平衡, 使得一些省市农村居民收入高出其它省市很多, 如上海市、北京市、天津市和浙江省等。而有的省就很低,如甘肃省、贵州省、云南省和陕 西省等。 (3)用加权最小二乘法修正异方差,分别选择权数 w1 = 过试算,认为用权数 w3 的效果最好。结果如下:

下表是某一地区 31 年中个人储蓄和个人收入数据资料 个人储蓄和个人收入数据(单位:元)

(1)建立一元回归函数,判断有无异方差存在,并说明存在异方差的原因。 (2)用适当方法修正异方差。 参考解答: 练习题 5.4 参考解答: (1)建立样本回归函数。

从估计的结果看,各项检验指标均显著。但由于收入通常存在不同的差异,因此需要判断模 型是否存在异方差。 首先,用图形法。从残差平方对解释变量散点图可以看出(见下图) ,模型很可能存在 异方差。

其次,用运用 Goldfeld-Quanadt 检验异方差。 第一,对变量 X 取值以升序排序。 第二,构造子样本。由于本例的样本容量为 31,删除 1/4 观测值,约 7 个,余下部分分 得两个样本区间:1―12 和 20―31,它们的样本个数均是 12 个。

第三,在样本区为1―12,所计算得到的残茶平方和为 20―31,所计算得到的残茶平方和为

第五,判断。在显著性水平为0.05条件下,分子分母的自由度均为10,查F分布表得临 界值为 F0.05 (10,10) = 2.98 ,因为 F = 6.0267 > F0.05 (10,10) = 2.98 ,所以拒绝原假设,表 明模型存在异方差。 最后,用ARCH方法检验异方差,则ARCH检验结果见下表:

由上述结论可知,拒绝原假设,则模型中随机误差项存在异方差。 (2)分别用权数 w1 = 效果最好,即

下表的数据是 2007 年我国建筑业总产值(X)和建筑业企业利润总额(Y) 。试根

据资料建立回归模型,并对模型判断是否存在异方差,如果有异方差,选用适当方法修正。 表 5.11


地 北 天 河 山 区 京 津 北 西

各地区建筑业总产值(X)和建筑业企业利润总额(Y)(单位:万元)

内蒙古 辽 吉 宁 林

海 重 四 贵 云 西 陕 甘 青 宁 新

南 庆 川 州 南 藏 西 肃 海 夏 疆

黑龙江 上 江 浙 安 福 江 山 河 海 苏 江 徽 建 西 东 南

数据来源:国家统计局网站

参考解答: 练习题 5.5 参考解答: (1)求 Y 对 X 的回归,得如下估计结果


用怀特检验的修正方法,即建立如下回归模型
通过计算得到如下结果:

注意,表中 E2 为残差平方 et 。 即

对该模型系数作判断,运用 F 或 LM 检验,可发现存在异方差。

? ? ? Y 2 的线性回归模型。再通过上述回归对 Y 和 Y 2 前的系数是否为零进行判断,从而检验原模

然后“OK”即得到检验结果为

从表中 F 统计量值和 LM 统计量值看,拒绝原假设,表明原模型存在异方差。

(2) 通过对权数的试算, 最后选择权数 w = 原后的结果)

1 , 用加权最小二乘法得到如下估计 (还 lX


对该模型进行检验,发现已无异方差。

下表为四川省农村人均纯收入、人均生活费支出、商品零售价格指数 1978 年至

2008 年时间序列数据。试根据该资料建立回归模型,并检验是否存在异方差,如果存在异 方差,选用适当方法进行修正。 表 5.12

1978――2008 四川省农村人均纯收入、人均生活费支出、商品零售价格指数

资料来源:中经网统计数据库 参考解答: 练习题 5.6 参考解答: (1)设 Y 表示人均生活费支出, X 表示农村人均纯收入,则建立样本回归函数

从估计结果看,各项检验指标均显著,但从经济意义看,改革开放以来,四川省农村经济发 生了巨大变化, 农村家庭纯收入的差距也有所拉大, 使得农村居民的消费水平的差距也有所 加大,在这种情况下,尽管是时间序列数据,也有可能存在异方差问题。而且从残差平方对 解释变量的散点图可以看出,模型很可能存在异方差(见下图) 。

进一步作利用 ARCH 方法检验异方差,得 ARCH 检验结果(见下表)

(2)运用加权最小二乘法,选权数为 w =


经检验,时模型的异方差问题有了明显的改进。

在5.6题的数据表里,如果考虑物价因素,则对异方差性的修正应该怎样进行?

参考解答: 练习题 5.7 参考解答: 剔除物价上涨因素后的回归结果如下


其中, Y1 代表实际消费支出, X 1 代表实际可支配收入。 用 ARCH 方法来检验模型是否存在异方差:

在显著性水平为 0.01 的条件下,接收原假设,模型不存在异方差。表明剔除物价上涨因素 之后,异方差的问题有所改善。

要求: (1)用普通最小二乘法估计收入―消费模型;


(2)检验收入―消费模型的自相关状况(5%显著水平) ; (3)用适当的方法消除模型中存在的问题。

参考解答: 练习题 6.1 参考解答 (1)收入―消费模型为

Y t = 13.4 X t 6.2 在研究生产中劳动所占份额的问题时,古扎拉蒂采用如下模型 模型 1 模型 2

其中,Y 为劳动投入,t 为时间。据 年数据,对初级金属工业得到如下结果: 模型 1

其中,括号内的数字为 t 统计量。 问: (1)模型 1 和模型 2 中是否有自相关; (2)如何判定自相关的存在? (3)怎样区分虚假自相关和真正的自相关。

参考解答: 练习题 6.2 参考解答 (1)模型 1 中有自相关,模型 2 中无自相关。 (2)通过 DW 检验进行判断。 模型 1:dL=1.077, dU=1.361, DW<dL, 因此有自相关。 模型 2:dL=0.946, dU=1.543, DW>dU, 因此无自相关。 (3)如果通过改变模型的设定可以消除自相关现象,则为虚假自相关,否则为真正自相 关。 6.3 下表是北京市连续 19 年城镇居民家庭人均收入与人均支出的数据。 年来城镇居民家庭收入与支出数据表(单位:元) 表 6.7 北京市 19 年来城镇居民家庭收入与支出数据表

要求: (1)建立居民收入―消费函数; (2)检验模型中存在的问题,并采取适当的补救措施预以处理; (3)对模型结果进行经济解释。

参考解答: 练习题 6.3 参考解答: (1)收入―消费模型为

? 使用普通最小二乘法估计 ρ 的估计值 ρ ,得


其经济意义为:北京市人均实际收入增加 1 元时,平均说来人均实际生活消费支出将增加 0.669 元。

注:资料来源于日本银行《经济统计年报》数据为 1990 年价格。

要求: (1)建立日本工薪家庭的收入―消费函数; (2)检验模型中存在的问题,并采取适当的补救措施预以处理; (3)对模型结果进行经济解释。 要求: (1)检测进口需求模型 Yt =

(2)采用科克伦-奥克特迭代法处理模型中的自相关问题。

参考解答: 练习题 6.4 参考解答 (1)收入―消费模型为

最终的消费模型为 Y t = 93.1 X t (3)模型说明日本工薪居民的边际消费倾向为 0.5351,即收入每增加 1 元,平均说来消费 增加 0.54 元。 6.5 下表给出了某地区 年的地区生产总值(Y)与固定资产投资额(X)的数据。 表 6.9 年份 82 85 88

要求: (1)使用对数线性模型

进行回归,并检验回归模型的

自相关性; (2)采用广义差分法处理模型中的自相关问题。 , (3) 令 X t = X t / X t ?1 (固定资产投资指数) Yt = Yt / Yt ?1 (地区生产总值增长指

第七章 分布滞后模型和自回归模型


7.1 表 7.11 中给出了 年期间美国的个人消费支出(PCE)和个人可支配收入 (PDI)数据,所有数字的单位都是 10 亿美元(1982 年的美元价)。

第二个模型回归的估计结果如下,

2)从模型一得到 MPC=1.008;从模型二得到,短期 MPC=0.9824,由于模型二为自回归模型, 要先转换为分布滞后模型才能得到长期边际消费倾向, 我们可以从库伊克变换倒推得到长期 MPC=0.9824/(1+0.0372)=0.9472。

7.2 表 7.12 中给出了某地区 年固定资产投资 Y 与销售额 X 的资料。


表 7.12 某地区 年固定资产投资 Y 与销售额 X 的资料(单位:亿元)

运用局部调整假定或自适应预期假定估计以下模型参数,并解释模型的经济意义,探测 模型扰动项的一阶自相关性: 1)设定模型


其中 Yt 为预期最佳值。 2)设定模型
其中 Yt 为预期最佳值。 3)设定模型

根据局部调整模型的参数关系,有 α = δα ,β 将上述估计结果代入得到:

故局部调整模型估计结果为: Yt

经济意义: 该地区销售额每增加 1 亿元, 未来预期最佳新增固定资产投资为 0.864001 亿元。 运用德宾 h 检验一阶自相关:

= 1.96 ,则接收原假设 ρ = 0 ,说明自回归模型不存

在局部调整假定下,先估计一阶自回归模型: ln Yt 回归的估计结果如下,

根据局部调整模型的参数关系,有 ln α = δ ln α , β 将上述估计结果代入得到:

故局部调整模型估计结果为: ln Yt


经济意义:该地区销售额每增加 1%,未来预期最佳新增固定资产投资为 1.22238%。 运用德宾 h 检验一阶自相关:

一阶自相关。 3)在自适应预期假定下,先估计一阶自回归模型: 回归的估计结果如下,

根据局部调整模型的参数关系,有 α = δα β 将上述估计结果代入得到:

故局部调整模型估计结果为: Y

经济意义: 该地区销售额每增加 1 亿元, 未来预期最佳新增固定资产投资为 0.864001 亿元。 运用德宾 h 检验一阶自相关:

7.3 利用表 7.12 的数据,取阿尔蒙多项式的次数 m=2,运用阿尔蒙多项式变换法估计 分布滞后模型:


由阿尔蒙多项式变换可得如下估计结果:

7.4 表 7.13 中给出了 年某地区基本建设新增固定资产 Y 和全省工业总产值 X 按当年价格计算的历史资料。

作局部调整假定,估计参数,并作解释。 作自适应预期假定,估计参数,并作解释。

(3) 比较上述两种模型的设定及拟合情况,你觉得哪一个模型较好,为什么? 参考解答: 练习题 7.4 参考解答: 1)在局部调整假定下,先估计一阶自回归模型, Yt 回归的估计结果如下,

可以看出, X t 的回归系数显著,而 Yt ?1 的回归系数不显著, R 不是很高,模型整体上对样 本数据拟合一般。 根据局部调整模型的参数关系, α = δα , β 0 = δβ , β1 = 1 ? δ , ?t = δ?t , 有 将上述估计结果

经济意义:为了达到全省工业总产值的计划值,寻求一个未来预期新增固定资产的最佳量。 全省工业总产值每计划增加 1(亿元) ,则未来预期最佳新增固定资产量为 0.1037 亿元。 2)在自适应预期假定下,先估计一阶自回归模型, Yt = α + β 0 X t + β 1 Yt ?1 + u t

经济意义: 新增固定资产的变化取决于全省工业总产值的预期值。 全省工业总产值每预期增 加增加 1(亿元) ,当期新增固定资产量为 0.1037(亿元) 。 3) 局部调整模型和自适应模型的区别在于: 局部调整模型是对应变量的局部调整而得到的; 而自适应模型是由解释变量的自适应过程而得到的。由回归结果可见,Y 滞后一期的回归系 数并不显著,说明两个模型的设定都不合理。

7.5 表 7.14 给出某地区各年末货币流通量 Y,社会商品零售额 X1、城乡居民储蓄余额 X 2 的数据。 表 7.14 某地区年末货币流通量、社会商品零售额、城乡居民储蓄余额数据(单位:亿元)


其中,Yt 为长期(或所需求的)货币流通量。试根据局部调整假设,作模型变换,估计并检验 参数,对参数经济意义做出解释。 参考解答: 练习题 7.5 参考解答:
故局部调整模型估计结果为:
经济意义:在其他条件不变的情况下,该地区社会商品零售额每增加 1 亿元,则预期年末货 币流通量增加 0.07978 亿元。同样,在其他条件不变的情况下,该地区城乡居民储蓄余额每 增加 1 亿元,则预期年末货币流通量增加 0.462126 亿元。 2)先对数变换模型形式, ln Yt

在局部调整假定下,先估计一阶自回归模型:

将上述估计结果代入得到:

故局部调整模型估计结果为:


经济意义:货币需求对社会商品零售额的长期弹性为:0.44104;货币需求对城乡居民储蓄 余额的长期弹性为0.384518。

其中:M 为实际货币流通量,Y * 为期望社会商品零售总额, R* 为期望储蓄总额,对于期望 值作如下假定:

其中 γ 1,γ 2 为期望系数,均为小于 1 的正数。 (1) 如何利用可观测的量来表示 M t ? (2) 分析这样变换存在什么问题? (3) 利用 7.5 题的数据进行回归,估计模型,并作检验。 练习题 7.6 参考解答: 参考解答: 1)首先将 M 滞后一期并乘上 (1 ? γ 1 ) 得到


再将原始方程减去该方程,得到

2) 从上面的变化中可看出, 随机扰动项变为 ?t = ?t ? (2 + γ 1 ? γ 2 ) ?t ?1 + (1 ? γ 1 )(1 ? γ 2 ) ?t ? 2 , 这就可能导致出现随机扰动项的自相关, 进而导致估计出来的结果是有偏的, 而且不是一致 估计。 3)对( ? )回归的估计结果如下,


可以看到, 只有 M t ?1 的回归系数在 10% 的显著性水平下是显著的, 其他回归系数均不显著; F 统计量较大,方程整体显著; R 较高,模型整体上对样本数据拟合较好。

7.7 考虑如下回归模型:

其中,y 为通货膨胀率,x 为生产设备使用率。 1) 生产设备使用率对通货膨胀率的短期影响和总的影响分别是多大? 2) 如果库伊克模型为 Yt = b1 + b2 X t + b3Yt ?1 + ?t , 你怎样得到生产设备使用率对通货膨 胀率的短期影响和长期影响? 参考解答: 练习题 7.7 参考解答: 1)该模型为有限分布滞后模型,故生产设备使用率对通货膨胀的短期影响为

分析该地区消费同收入的关系 1) 做 Yt 关于 X t 的回归,对回归结果进行分析判断; 2) 建立适当的分布滞后模型,用库伊克变换转换为库伊克模型后进行估计,并对估计 结果进行分析判断。 参考解答: 练习题 7.8 参考解答: 1)做 Yt 关于 X t 的回归,回归的估计结果如下,

从回归结果来看,t 检验值、F 检验值及 R 都显著,但在显著性水平 α = 0.05 上,DW 值


2)事实上,当年消费不仅受当年收入的影响,而且还受过去各年收入水平的影响,因此, 我们在上述模型中增添货币收入总额 X 的滞后变量进行分析。 如前所述, 对分布滞后模型直 接进行估计会存在自由度损失和多重共线性等问题。在此,选择库伊克模型进行回归分析, 即估计如下模型: Yt

回归结果显示,t 检验值、F 检验值及 R 2 都显著,但

模型作进一步修改。 抱歉啊!第九和第十没有找到咯,谅解一下啊,我会及时补上的! 抱歉啊!第九和第十没有找到咯,谅解一下啊,我会及时补上的!


11.1 考虑以下凯恩斯收入决定模型:
其中,C=消费支出,I=投资指出,Y=收入,G=政府支出; Gt 和Yt ?1 是前定变量。 (1)导出模型的简化型方程并判定上述方程中哪些是可识别的(恰好或过度) 。 (2)你将用什么方法估计过度可识别方程和恰好可识别方程中的参数。 参考解答: 练习题 11.1 参考解答:

由模型的结构型,M=3,K=2。下面只对结构型模型中的第一个方程和第二个方程判断 其识别性。 首先,用阶条件判断。 第一个方程,已知 m1 = 2, k1 = 0 ,因为


所以该方程有可能为过度识别。 第二个方程,已知 m2 = 2, k2 = 1 ,因为
所以该方程有可能恰好识别。 第三个方程为定义式,故可不判断其识别性。 其次,用秩条件判断。写出结构型方程组的参数矩阵
对于第一个方程,划去该方程所在的行和该方程中非零系数所在的列,得

由上述矩阵可得到三个非零行列式,根据阶条件,该方程为过度识别。事实上,所得到的 矩阵的秩为 2,则表明该方程是可识别,再结合阶条件,所以该方程为过度识别。同理,可 判断第二个方程为恰好识别。 (2)根据上述判断的结果,第一个方程可用两段最小二乘法估计参数;第二个方程可 用间接最小二乘法估计参数。

其中Wt 、 Pt 、 M t 和 X t 分别是收益,价格,进口价格以及劳动生产力的百分率变化(所有百

分率变化,均相对于上一年而言) Vt 代表未填补的职位空缺率(相对于职工总人数的百 ,而 分率) 。 试根据上述资料对“由于 OLS 和 TSLS 结果基本相同,故 TSLS 是无意义的。 ”这一说 法加以评论。 参考解答: 练习题 11.2 参考解答: 从两种方法估计的结果看,尽管系数的估计值非常接近,但不能说用 TSLS 方法估计得 到的估计值无意义。原因是用 TSLS 方法能保证参数的估计是一致的,而用 OLS 方法估计 得到的参数估计值在统计上是有偏且非一致。因此,从这个意义上说,运用 TSLS 方法得到 的参数估计值可靠、可信。

其中,M=货币,Y=收入,R=利率,P=价格, u1t , u 2t 为误差项;Y 、R 和 P 是前定变量。 (1) 需求函数可识别吗? (2) 供给函数可识别吗? (3) 你会用什么方法去估计可识别的方程中的参数?为什么? (4) 假设我们把供给函数加以修改,多加进两个解释变量Yt ?1 和 M t ?1 ,会出现什么识 别问题?你还会用你在(3)中用的方法吗?为什么? 参考解答: 练习题 11.3 参考解答: (1)首先,用阶条件判断如下:根据模型可知 M = 2, K = 3 ,对于需求函数,有


所以,该方程有可能是恰好识别。 其次,用秩条件判断。将结构型模型转化为简化型模型后,写出其系数的矩阵为
对于需求函数, 划掉第一行和第一行里零所对应的非零元素以外的元素, 得到一个非零元素,

即 1,按照秩条件原理,说明该方程为恰好识别。 (2)根据识别的原理,对于供给函数,运用阶条件有


所以,该方程有可能是过度识别。对于供给函数,按秩条件原理,可得三个非零元素,按照 秩条件的原理,说明该方程为过度识别。 (3)对于货币需求函数在过度识别的情况下,可考虑用间接最小二乘法估计参数;对 于货币供给函数为恰好识别的情况下,可考虑用两段最小二乘法估计参数。 (4)在货币供给函数里再引进变量Yt ?1 和 M t ?1 ,使得函数变为过度识别的情况,这时 对参数的估计就只能用两段最小二乘法。

11.4 考虑以下模型:


其中 M t (货币供给)是外生变量; Rt 为利率,Yt 为 GDP,它们为内生变量。 (1)请说出此模型的合理性。 (2)这些方程可识别吗? 假使把上述模型改变如下:
判断此方程组是否可识别,其中 Yt ?1 为滞后内生变量。 参考解答: 练习题 11.4 参考解答: (1)在上述第二个函数显然不正确,因为,按照经济学原理,GDP 应该受到投入要素 的影响,而不是货币的价值利率的影响。 (2)根据识别的意义,可知上述模型中第一个方程,包含了模型中的全体变量,所以 为不可识别;根据识别的阶条件,已知 M = 2, K = 1 ,对于第一个方程,有
则表明该方程为不可识别。

第二个方程除了 Rt 和Yt 外, 还有第一个方程没有包含的变量 M t , 所以该方程为可识别。 从而整个方程组为不可识别。 (3)将模型变为上述第二种形式,从结构的形式看与第一种情况一致,所以方程组的 识别情况没有变化,仍然为不可识别。

设我国的关于价格、消费、工资模型设定为

其中C、P均是以上一年为 100。资料来源:国家统计局网站 (1)该方程组是否可识别? (2)选用适当的方法估计模型的未知参数?。 参考解答: 练习题 11.5 参考解答:

(1)由于该方程组为递归模型,而递归模型并非真正意义下的联立方程组模型。因而 淡化它的识别性判断。事实上,该方程组模型中除第一个方程为恰好识别外,其余两个方 程均是不可识别。 (2)直接利用OLS进行估计,结果如下


11.6 表中给出了四川省宏观经济统计资料,试判断模型的识别性,再用 TSLS 法估计 如下宏观经济模型

四川省宏观经济统计资料 (单位:亿元)

资料来源:四川省统计局网站 参考解答: 练习题 11.6 参考解答: (1)依题意,方程组中的内生变量个数 M=3,外生变量的个数为 K=3。根据阶条件, 对于第一个方程,有 K-k1=3-0>m1-1=2-1 所以,该方程可能为过度识别。 对于第二个方程,有 K-k2=3-1> m2-1=2-1 所以,该方程仍可能为过度识别。 第三个方程是定义方程,所以不需对其识别性进行判别。 将结构型模型转化为标准型,并写出其系数的矩阵形式


按照秩条件,对于第一个方程,可的如下矩阵
由此可得到三个非零二阶行列式,即表明该方程是过度识别。同理,对于第二个方程有
可得两个非零行列式,因此该方程也是过度识别。 (2)对于第一个方程运用 TSLS 估计得到
对于第二个方程运用 TSLS 估计得到
最后,得该问题的联立方程组模型为
其中, e1t 和 e2t 分别为消费函数和投资函数中的残差。

内容提示:《计量经济学》学年第1学期试卷(A)期末考试卷

文档格式:PDF| 浏览次数:157| 上传日期: 00:34:32| 文档星级:?????

我要回帖

更多关于 回归直线方程公式 的文章

 

随机推荐