计量模型，剔除完全不可能结构方程模型的样本量点，结果会怎么样

科学教育 | 学习帮助 | 出国/留学 | 工程技术科学 | 教育/科学 | 英语听力 | 梦幻西游电脑版 | 视频会议 | 口臭 | 暗黑破坏神3（游戏） | 面相 | 赛尔号 | linux | 山西省 | Xbox One | 思修 | 易经 | solidworks | 钢铁雄心4 | 休闲游戏 | 魔兽争霸3混乱之治 | 显卡 | 武汉大学 | 塞尔达传说（游戏） | 校服 | 剑侠情缘网络版叁 | 脱发 | 日本文化 | 数学建模 | 二次元 | 部落冲突（游戏） | 肖战 | 街机游戏 | 拳皇 | 马鞍山市 | 扑克 | 完美世界（游戏） | 三国志（游戏） | 热血传奇（游戏） | 意大利 | 跆拳道 | 东莞市 | 糖尿病 | 古琴 | 三国 | 电视节目 | 百度 | qq音乐 | 配音 | 电视 | 任天堂 | 科幻小说 | 虚拟专用服务器 | QQ游戏 | 大熊猫 | 微电影 | Android | 竞技游戏 | 动画制作 | QQ炫舞 | 电源 | 日语 | 魔兽争霸3冰封王座 | 产业 | ios开发 | 百度云 | 动画电影 | nba篮球 | 羽生结弦 | iOS应用 | galgame | 电吉他 | 平板电脑 | 周星驰（人物） | 离婚 | 后宫·甄嬛传（书籍） | 牙科 | 游戏开发 | 网络直播 | ios游戏 | 电子邮件 | SNH48 | 民国 | 美容 | 舰队 Collection | 心理 | Mac | 羽毛球技术 | 互联网公司 | 大学生兼职 | 烘焙 | 诸葛亮 | 跑跑卡丁车 | 武侠小说 | 微博 | 骨折 | 掌上游戏机 | 玉米 | 中国足球 | 电脑配置 | 洛奇英雄传 | 硬盘 | 张璐 | akb48 | 炉石传说 | 韩国 | 蓄电池 | QQ空间 | 房贷 | 麦克风 | 相声演员 | 抑郁 | 天下2（游戏） | 农业科学 | 神话 | 农历 | 中国足球协会超级联赛（CSL） | 流星花园 | 易烊千玺 | 火影忍者 | 日语歌曲 | 巴西 | 红酒 | 化疗 | 占地 | 网络小说 | 香烟 | 传奇世界 | 名字 | 日本电影 | 表演 | 西藏自治区 | 英雄传说：闪之轨迹（游戏） | 足球彩票 | 摩尔庄园 | 中国工商银行 | 游戏手柄 | 陈奕迅 | 联赛 | 天体物理学 | 英格兰足球超级联赛 | 超级机器人大战 | 命令与征服：红色警戒2（游戏） | 郭富城 | 一级方程式赛车（f1） | Adobe Photoshop | 英文歌曲 | 玄幻小说 | 猫和老鼠 | 杨凡 | 书籍改编电影 | 俄罗斯 | 网络赚钱 | 罗玉凤 | 刺客信条2 | 角色扮演 | 食物 | 药物 | 杨洋（演员） | 信息安全 | 胡歌（演员） | 张子枫 | 古典音乐 | 时尚 | 大片 | 电脑游戏 | 签证 | 徐佳莹 | 耽美 | 游戏攻略 | 音乐剧 | 前女友 | 男性 | 肠胃 | 刺客信条起源 | 剧场版 | 国际足联世界杯 | 彩虹六号（游戏） | 赵丽颖（演员） | 天体生物学 | 战神（游戏） | 吉他学习 | 飞机 | 三菱商事 | 关节炎 | 斗鱼直播 | 发电 | 张继科 | 华语流行音乐 | 搏击项目 | 主题曲 | 李信 | 刘德华（演员） | 即时战略游戏（RTS） | 欧阳娜娜 | 网址导航 | 海贼王 | 山地车 | 豆瓣电影 | 广场舞 |

你的位置：网站首页 >> 频道首页 >>理工学科 >>计量模型，剔除完全不可能结构方程模型的样本量点，结果会怎么样

计量模型，剔除完全不可能结构方程模型的样本量点，结果会怎么样

来源：蜘蛛抓取(WebSpider) 时间：2017-06-11 04:45 标签：剔除样本异常值

百度文库-信息提示
两大类热门资源免费畅读
续费一年阅读会员，立省24元！
对不起，该文档已被删除，无法查看
15秒后，自动返回首页苹果/安卓/wp
积分 968, 距离下一级还需 407 积分
权限: 自定义头衔, 签名中使用图片, 隐身
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡, 显身卡, 匿名卡, 抢沙发下一级可获得
权限: 设置帖子权限道具: 提升卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
开心签到天数: 8 天连续签到: 1 天[LV.3]偶尔看看II
本帖最后由 wanghaidong918 于
07:32 编辑
想请教一个问题，我现在在做的一个课题，总体样本有超过5万个数据，但是样本中有近3万个样本被解释变量这项只能取0值，想问下这部分的样本是不是要剔除，只取为正值的样本，这样只剩2万多个样本了，还是取0值全部回归？
载入中......
那的先追查为什么有那么多0
然后在想办法处理
Stata版版规
用Heckman两步法做
heckman 不是随便使用的
Stata版版规
这些 0 至少有两种可能的解释：
一是缺漏值；二是其真实值就为零。
因此，若直接删除，并不合适。
建议采用 Tobit 模型进行处理。
help tobit
厉害也！！很多都方法没有听说那
看了李子奈老师的文章
我的数据其实是0值
按照其说法应该采用Heckman做
Tobit和Probit都有selection bias 的问题
不过用Heckman 的问题就是难以找到合适的排除性约束
看了一些国外同类文献
有个比较牛的教授发了一篇比较牛的在一个比较牛的杂志上
用了一个变量做排除性
我想也用这个
但就是苦于没有数据
最近几年，我们对农户借贷需求进行了较为广泛的调查，采集了青海、新疆、甘肃、河北、黑龙江、吉林、山西、湖南、湖北、河南、安徽、江西、陕西、山东、辽宁、内蒙古等16省区的72个县、440多个村庄的5100家农户的数据。其中，在一年中发生借贷行为的农户占55.3％(包括向亲友借贷)，为2820户，其余2280户没有发生借贷。对于这一宝贵的数据资源，当然要充分利用。于是，为了对农户借贷行为进行因素分析，不同的研究者建立了不同的计量经济学模型。有人利用2820户发生借贷的农户的借贷额为被解释变量，建立经典的回归模型；有人认为应该将没有发生借贷的农户信息加以利用，其借贷额为0，于是利用5100农户为样本，建立经典的回归模型；有人认为不应该将没有发生借贷的农户的借贷额统统视为0，而应该视为小于等于0(≤0)，于是利用5100农户为样本，建立了归并(censoring)数据模型(Tobit模型)。有人认为不应该将没有发生借贷的农户的借贷额统统视为小于等于0，因为其中一部分农户有借贷需求，只是因为各种原因(例如提出借贷被拒绝，担心借不到而不敢提出借贷要求等)而没有发生实际借贷。所以，应该按照Heckman两步法建立模型，即首先利用全部样本信息建立借贷是否发生的二元选择模型，然后再利用2820户发生借贷的农户为样本，建立借贷额的因素分析回归模型。显然，最后一种模型是正确的，其他都是不正确的。那么，为什么会发生这些现象？
上述例子从不同的角度反映了计量经济学模型与数据之间的关系。前者反映了计量经济学模型估计结果对数据质量的依赖性；后者反映了计量经济学模型类型对数据类型的依赖性。正如李子奈(2007)指出的，在我国计量经济学应用研究广泛开展的今天，问题和错误也普遍存在。重要的原因之一是对计量经济学模型方法论基础缺乏正确的理解，其中包括计量经济学模型的数据基础问题
本文来源于CSSCI学术论文网: 全文阅读链接：
以上是李子奈老师文章里的一段话
我做的例子就和上面的情况相似
李老师的文章写得很好
建议大家都可以去读一读
新人学习了！！
初级热心勋章
初级热心勋章
初级信用勋章
初级信用勋章
初级学术勋章
初级学术勋章
中级学术勋章
中级学术勋章
中级热心勋章
中级热心勋章
中级信用勋章
中级信用勋章
高级热心勋章
高级热心勋章
高级信用勋章
高级信用勋章
无限扩大经管职场人脉圈！每天抽选10位免费名额，现在就扫& 论坛VIP& 贵宾会员& 可免费加入
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向，请联系（010-）；
邮箱：service@pinggu.org
投诉或不良信息处理：（010-）
京ICP证090565号
论坛法律顾问：王进律师少0.4795杯。（2分）
（3）不能。原因在于要了解全美国所有人的咖啡消费情况几乎是不可能的。（2分）
（4）不能。在同一条需求曲线上不同点的价格弹性不同，若要求价格弹性，须给出具体的X值及与之对应的Y值。（2分）
15、答：由已知条件可知，?X
ni?1680Yi?8，?10n10
??(XY??Y?)iiiiii（3分）
?0?111?168??111
??X?2?10?102i2i2i2
i22（3分）
???(Xi?)(Yi?)
(Xi?)2?4（2分） 33160
??????111?0..22（2分） ?01
16. 解答：（1）这是一个对数化以后表现为线性关系的模型，lnL的系数为1.451意味着资本投入K保持不变时劳动―产出弹性为1.451 ；（3分）lnK的系数为0.384意味着劳动投入L保持不变时资本―产出弹性为0.384（2分）.
（2）系数符号符合预期，作为弹性，都是正值，而且都通过了参数的显著性检验（t检验）（5分，要求能够把t值计算出来）。
217. 解答：该消费模型的判定系数R?0.95，Ｆ统计量的值F?107.37，均很高，表明模型的整体拟合程度很高。
计算各回归系数估计量的t统计量值得：t0?8.133?8.92?0.91，t1?1.059?0.17?6.10
t2?0.452?0.66?0.69，t3?0.121?1.09?0.11。除t1外，其余T值均很小。工资收入Ｗ的系数t检验值虽然显著，但该系数的估计值却过大，该值为工资收入对消费的边际效应，它的值为1.059意味着工资收入每增加一美元，消费支出增长将超过一美元，这与经济理论和生活常识都不符。（5分）另外，尽管从理论上讲，非工资―非农业收入与农业收入也是消费行为的重要解释变量，但二者各自的t检验却显示出它们的效应与0无明显差异。这些迹象均表明模型中存在严重的多重共线性，不同收入部分之间的相互关系掩盖了各个部分对解释消费行为的单独影响。（3分）
18. 解答: (1)?1?
(2)?1?22n?18?1(1?R2)?1??(1?0.75)?0.65（3分） n?k?18?2?19?1?(1?0.35)??0.04；负值也是有可能的。（4分） 9?3?1
31?12?(1?0.95)?0.94 （3分） (3)?1?31?5?1
19. 解答：当b1?b2?1时，模型变为yt?x2t?b0?b1(x1t?x2t)?ut，可作为一元回归模型来对待
b1?n(x1t?x2t)(yt?x2t)?(x1t?x2t)(yt?x2t)
n(x1t?x2t)?((x1t?x2t))22（5分）
当b1?b2时，模型变为yt?b0?b1(x1t?x2t)?ut,同样可作为一元回归模型来对待
b1?n(x1t?x2t)yt?(x1t?x2t)yt
n(x1t?x2t)2?((x1t?x2t))2（5分）
20．解答:（1）第2个方程更合理一些，，因为某天慢跑者的人数同该天日照的小时数应该是正相关的。（4分）
（2）出现不同符号的原因很可能是由于X2与X3高度相关而导致出现多重共线性的缘故。从生活经验来看也是如此，日照时间长，必然当天的最高气温也就高。而日照时间长度和第二天需交学期论文的班级数是没有相关性的。（6分）
21．解答：（1）x1i是盒饭价格，x2i是气温，x3i是学校当日的学生数量，x4i是附近餐厅的盒饭价格。（4分）
（2）在四个解释变量中，附近餐厅的盒饭价格同校园内食堂每天卖出的盒饭数量应该是负相关关系，其符号应该为负，应为x4i；学校当日的学生数量每变化一个单位，盒饭相应的变化数量不会是28.4或者12.7，应该是小于1的，应为x3i；至于其余两个变量，从一般经验来看，被解释变量对价格的反应会比对气温的反应更灵敏一些，所以x1i是盒饭价格，x2i是气温。
22. 解：（一）原模型：yi?b0?b1xi?ui （1）等号两边同除以xi，
（2分） yiui1?b0?b1?
新模型：xixixi
令yi?yi*1u,xi?,vi?i
则：（2）变为yi*?b1?b0xi*?vi
（2分） ui1（2分） )?2(?2xi2)??2新模型不存在异方差性。xixi此时Var(vi)?Var(
（二）对yi*?b1?b0xi*?vi进行普通最小二乘估计
yi*1,xi?xixi?nxi*yi*?xi*yi*?b0?n(xi*)2?(xi*)2??b1?i*?b0i*?
（进一步带入计算也可） * 其中yi?
23.解：（1）H0:ut为同方差性;
H1:ut为异方差性;（2分）
（2）F?RSS10.466E?17??1.29（3分） RSS20.36E?17
（3）F0.05(10,10)?2.98（2分）
（4）F?F0.05(10,10)，接受原假设，认为随机误差项为同方差性。（3分）
24.解：原模型：yi?a?ui
根据ui?N(0,?2xi);E(uiuj)?0,i?j
为消除异方差性，模型等号两边同除以
模型变为：y?ua?（2分）
yu*xi?vi?令y?*i
则得到新模型：yi*?axi*?vi
1（2分） ?(?2xi)??2新模型不存在异方差性。xi此时Var(vi)?Var利用普通最小二乘法，估计参数得：
x?**?*2yx?xiii
25.解：原模型：yi?b0?b1x1?ui ， Var(ui)??2x12模型存在异方差性
为消除异方差性，模型两边同除以xi， yiui1?b?b?得：01xixixi
（2分） yi*1ui,xi?,vi?令y?xixixi
得：yi* ?b1?b0xi*?vi
（2分） ui1)?2(?2xi2)??2新模型不存在异方差性
（1分） xixi此时Var(vi)?Var(
由已知数据，得（2分）
*根据以上数据，对yi?b1?b0xi*?vi进行普通最小二乘估计得：
?nxi*yi*?xi*yi*?b0?n(xi*)2?(xi*)2??**b??b1i0i?
?1.77?b??3.280??0.54解得?（3分） 5.951.15?b??3.28??0.441?55?26.答案：(1) 题中所估计的回归方程的经济含义：该回归方程是一个对数线性模型，可还原为指数的形式为：Y??3.938L1.451K0.3841，是一个C-D函数，1.451为劳动产出弹性，0.3841为资本产出弹性。因为1.451+0.3841〉1，所以该生产函数存在规模经济。（6分）
(2) 该回归方程的估计中存在什么问题?应如何改进?
因为DW=0.858, dL=1.38,即0.858&1.38,故存在一阶正自相关。可利用GLS方法消除自相关的影响。（4分）
27．（1）何谓计量经济模型的自相关性？
答：如果对于不同的样本点，随机误差项之间不再是完全互相独立，而是存在某种相关性，则出现序列相关性。如存在：E(?i?i?1)?0,称为一阶序列相关，或自相关。（3分）
（2）试检验该模型是否存在一阶自相关，为什么？答：存在。（2分）
（3）自相关会给建立的计量经济模型产生哪些影响？
答：1参数估计两非有效;2 变量的显著性检验失去意义。3模型的预测失效。（3分）
（4）如果该模型存在自相关，试写出消除一阶自相关的方法和步骤。
（临界值dL?1.24，dU?1.43）
答：1构造D.W统计量并查表；2与临界值相比较，以判断模型的自相关状态。（2分）
28．答：（1）由于地方政府往往是根据过去的经验、当前的经济状况以及期望的经济发展前景来定制地区最低限度工资水平的，而这些因素没有反映在上述模型中，而是被归结到了模型的随机扰动项中，因此 gMIN1 与?不仅异期相关，而且往往是同期相关的，这将引起OLS估计量的偏误，甚至当样本容量增大时也不具有一致性。（5分）
（2）全国最低限度的制定主要根据全国国整体的情况而定，因此gMIN基本与上述模型的随机扰动项无关。（2分）
（3）由于地方政府在制定本地区最低工资水平时往往考虑全国的最低工资水平的要求，因此gMIN1与gMIN具有较强的相关性。结合（2）知gMIN可以作为gMIN1的工具变量使用。（3分）
29．解答：（1）这是一个确定的关系，各产业生产总值之和等于国内生产总值。作为计量模型不合理。（3分）（2）（3）
（4）（5）都是合理的计量经济模型。（4分）（6）不合理。发电量和钢铁产量影响对煤炭的需求，但不会影响煤炭的产量。作为解释变量没有意义。（3分）
30．解答：（1）模型中RIt的系数符号为负，不符合常理。居民收入越多意味着消费越多，二者应该是正相关关系。（3分）
（2）Y的系数是1.2，这就意味着每增加一元钱，居民消费支出平均增加1.2元，处于一种入不敷出的状态，这是不可能的，至少对一个表示一般关系的宏观计量经济模型来说是不可能的。（4分）
(3) L的系数符号为负，不合理。职工人数越多工业总产值越少是不合理的。这很可能是由于工业生产资金和职工人数两者相关造成多重共线性产生的。（3分）
31．解答：（1）临界值t =1.7291小于18.7，认为回归系数显著地不为0.（4分）
（2）参数估计量的标准误差：0.81/18.7=0.0433（3分）
（3）不包括。因为这是一个消费函数，自发消费为15单位，预测区间包括0是不合理的。（3分）
32．解答：（1）对于yt?b0?b1x1t?b2x2t?...?bkxkt?ut如果随机误差项的各期值之间存在着相关关系，即
（3分） cov(ut,us)?E(utus)?0(t,s?1,2...,k)称随机误差项之间存在自相关性。
（2）该模型存在一阶正的自相关，因为0&D.W＝0.3474&dL?1.24 （3分）
（3）自相关性的后果有以下几个方面：①模型参数估计值不具有最优性；②随机误差项的方差一般会低估；③模型的统计检验失效；④区间估计和预测区间的精度降低。（4分）导读：（2）参数的最小二乘估计量不是一个有效的估计量，（2分）但在实际计量经济学问题中，答：（1）经济变量惯性的作用引起随机误差项自相关，（1分）（2）经济行为的滞后性引起随机误差项自相关，（2分）（2）经济变量的共同趋势（1分）（3）滞后变量的引入（1分）（4）模型的，（3分）（2）参数估计量的方差无穷大（或无法估计）（2分），但各回归系数估计量的方差很大，37．答：所谓方差膨胀因子是存在多重共线
回归模型中，如果随机误差项的方差不是常数，即对不同的解释变量观测值彼此不同，则称随机项ui具
2var(u)??有异方差性，即it?常数（t=1，2，??，n）。（3分）例如，利用横截面数据研究
消费和收入之间的关系时，对收入较少的家庭在满足基本消费支出之后的剩余收入已经不多，用在购买生活必需品上的比例较大，消费的分散幅度不大。收入较多的家庭有更多可自由支配的收入，使得这些家庭的消费有更大的选择范围。由于个性、爱好、储蓄心理、消费习惯和家庭成员构成等那个的差异，使消费的分散幅度增大，或者说低收入家庭消费的分散度和高收入家庭消费得分散度相比较，可以认为牵着小于后者。这种被解释变量的分散幅度的变化，反映到模型中，可以理解为误差项方差的变化。（2分）
20.产生原因：（1）模型中遗漏了某些解释变量；（2）模型函数形式的设定误差；（3）样本数据的测量误差；（4）随机因素的影响。（2分）
产生的影响：如果线性回归模型的随机误差项存在异方差性，会对模型参数估计、模型检验及模型应用带来重大影响，主要有：（1）不影响模型参数最小二乘估计值的无偏性；（2）参数的最小二乘估计量不是一个有效的估计量；（3）对模型参数估计值的显著性检验失效；（4）模型估计式的代表性降低，预测精度精度降低。（3分）
21.检验方法：（1）图示检验法；（1分）（2）戈德菲尔德―匡特检验；（1分）（3）怀特检验；（1分）（4）戈里瑟检验和帕克检验（残差回归检验法）；（1分）（5）ARCH检验（自回归条件异方差检验）（1分）
22.解决方法：（1）模型变换法；（2分）（2）加权最小二乘法；（2分）（3）模型的对数变换等（1分）
23.加权最小二乘法的基本原理：最小二乘法的基本原理是使残差平方和?e2
t为最小，在异方差情况
2下，总体回归直线对于不同的xt,et的波动幅度相差很大。随机误差项方差?t越小，样本点yt对总体
回归直线的偏离程度越低，残差et的可信度越高（或者说样本点的代表性越强）；而?t较大的样本点可2
能会偏离总体回归直线很远，et的可信度较低（或者说样本点的代表性较弱）。（2分）因此，在考虑异方差模型的拟合总误差时，对于不同的et应该区别对待。具体做法：对较小的et给于充分的重视，即给于较大的权数；对较大的et给于充分的重视，即给于较小的权数。更好的使2222e?t反映var(ui)对残差平方和的影响程度，从而改善参数估计的统计性质。（3分）
24. 样本分段法（即戈德菲尔特―匡特检验）的基本原理：将样本分为容量相等的两部分，然后分别对样本1和样本2进行回归，并计算两个子样本的残差平方和，如果随机误差项是同方差的，则这两个子样本的残差平方和应该大致相等；如果是异方差的，则两者差别较大，以此来判断是否存在异方差。（3分）使用条件：（1）样本容量要尽可能大，一般而言应该在参数个数两倍以上；（2）ut服从正态分布，且除了异方差条件外，其它假定均满足。（2分）
25．简述DW检验的局限性。
答：从判断准则中看到，DW检验存在两个主要的局限性：首先，存在一个不能确定的D.W.值区域，这是这种检验方法的一大缺陷。（2分）其次：D.W.检验只能检验一阶自相关。（2分）但在实际计量经济学问题中，一阶自相关是出现最多的一类序列相关，而且经验表明，如果不存在一阶自相关，一般也不存在高阶序列相关。所以在实际应用中，对于序列相关问题―般只进行D.W.检验。（1分）
26．序列相关性的后果。
答：（1）模型参数估计值不具有最优性；（1分）（2）随机误差项的方差一般会低估；（1分）（3）模型的统计检验失效；（1分）（4）区间估计和预测区间的精度降低。（1分）（全对即加1分）
27．简述序列相关性的几种检验方法。
答：（1）图示法；（1分）（2）D-W检验；（1分）（3）回归检验法；（1分）（4）另外，偏相关系数检验，布罗斯―戈弗雷检验或拉格朗日乘数检验都可以用来检验高阶序列相关。（2分）
28．广义最小二乘法（GLS）的基本思想是什么？
答:基本思想就是对违反基本假定的模型做适当的线性变换，使其转化成满足基本假定的模型，从而可以使用OLS方法估计模型。（5分）
29．自相关性产生的原因有那些？
答：（1）经济变量惯性的作用引起随机误差项自相关；（1分）（2）经济行为的滞后性引起随机误差项自相关；（1分）(3)一些随机因素的干扰或影响引起随机误差项自相关；（1分）（4）模型设定误差引起随机误差项自相关；（1分）（5）观测数据处理引起随机误差项自相关。（1分）
30．请简述什么是虚假序列相关，如何避免？
答：数据表现出序列相关，而事实上并不存在序列相关。（2分）要避免虚假序列相关，就应在做定量分析之间先进行定性分析，看从理论上或经验上是否有存在序列相关的可能，可能性是多大。（3分）
31．DW值与一阶自相关系数的关系是什么？ ??1?答：?DW?) 或者DW?2(1??2
32．答：多重共线性是指解释变量之间存在完全或近似的线性关系。
产生多重共线性主要有下述原因：
（1）样本数据的采集是被动的，只能在一个有限的范围内得到观察值，无法进行重复试验。（2分）（2）经济变量的共同趋势（1分）（3）滞后变量的引入（1分）（4）模型的解释变量选择不当（1分）
33．答：完全多重共线性是指对于线性回归模型
Y＝?1X1??2X2?......??kXk?u
若c1X1j?c2X2j?...?ckXkj=0,
j=1,2,...,n
其中c1，c2，...,ck是不全为0的常数
则称这些解释变量的样本观测值之间存在完全多重共线性。（2分）
不完全多重共线性是指对于多元线性回归模型
Y＝?1X1??2X2?......??kXk?u
若c1X1j?c2X2j?...?ckXkj+v=0,
j=1,2,...,n
其中c1，c2，...,ck是不全为0的常数，v为随机误差项
则称这些解释变量的样本观测之间存在不完全多重共线性。（3分）
34．答：（1）无法估计模型的参数，即不能独立分辨各个解释变量对因变量的影响。（3分）（2）参数估计量的方差无穷大（或无法估计）（2分）
35．答：（1）可以估计参数，但参数估计不稳定。（2分）（2）参数估计值对样本数据的略有变化或样本容量的稍有增减变化敏感。（1分）（3）各解释变量对被解释变量的影响难精确鉴别。（1分）（4）t检验不容易拒绝原假设。（1分）
36．答：（1）模型总体性检验F值和R2值都很高，但各回归系数估计量的方差很大，t值很低，系数不能通过显著性检验。（2分）
（2）回归系数值难以置信或符号错误。（1分）
（3）参数估计值对删除或增加少量观测值，以及删除一个不显著的解释变量非常敏感。（2分）
37．答：所谓方差膨胀因子是存在多重共线性时回归系数估计量的方差与无多重共线性时回归系数估计
?)=1时，认为原模型不存在“多重共线性问题”；量的方差对比而得出的比值系数。（2分）若VIF(?i
（1分）若VIF(?i)&1时，则认为原模型存在“多重共线性问题”；（1分）若VIF(?i)&5时，则模型的“多重共线性问题”的程度是很严重的，而且是非常有害的。（1分）
38．模型中引入虚拟变量的作用是什么？
答案：（1）可以描述和测量定性因素的影响；（2分）
（2）能够正确反映经济变量之间的关系，提高模型的精度；（2分）
（3）便于处理异常数据。（1分）
39．虚拟变量引入的原则是什么？
答案：（1）如果一个定性因素有m方面的特征，则在模型中引入m-1个虚拟变量；（1分）
（2）如果模型中有m个定性因素，而每个定性因素只有两方面的属性或特征，则在模型中引入m个虚拟变量；如果定性因素有两个及以上个属性，则参照“一个因素多个属性”的设置虚拟变量。（2分）
（3）虚拟变量取值应从分析问题的目的出发予以界定；（1分）
（4）虚拟变量在单一方程中可以作为解释变量也可以作为被解释变量。（1分）
40．虚拟变量引入的方式及每种方式的作用是什么？
答案：（1）加法方式：其作用是改变了模型的截距水平；（2分）
（2）乘法方式：其作用在于两个模型间的比较、因素间的交互影响分析和提高模型的描述精度；（2分）
（3）一般方式：即影响模型的截距有影响模型的斜率。（1分）
41．判断计量经济模型优劣的基本原则是什么？
答案：（1）模型应力求简单；（1分）（2）模型具有可识别性；（1分）（3）模型具有较高的拟合优度；（1分）（4）模型应与理论相一致；（1分）（5）模型具有较好的超样本功能。（1分）
42．模型设定误差的类型有那些？
答案：（1）模型中添加了无关的解释变量；（2分）（2）模型中遗漏了重要的解释变量；（2分）（3）模型使用了不恰当的形式。（1分）
43．工具变量选择必须满足的条件是什么？
答案：选择工具变量必须满足以下两个条件：（1）工具变量与模型中的随机解释变量高度相关；（3分）
（2）工具变量与模型的随机误差项不相关。（2分）
44．设定误差产生的主要原因是什么？
答案：原因有四：（1）模型的制定者不熟悉相应的理论知识；（1分）（2）对经济问题本身认识不够或不熟悉前人的相关工作；（1分）（3）模型制定者缺乏相关变量的数据；（1分）（4）解释变量无法测量或数据本身存在测量误差。（2分）
45．在建立计量经济学模型时，什么时候，为什么要引入虚拟变量？
答案：在现实生活中，影响经济问题的因素除具有数量特征的变量外，还有一类变量，这类变量所反映的并不是数量而是现象的某些属性或特征，即它们反映的是现象的质的特征。这些因素还很可能是重要的影响因素，这时就需要在模型中引入这类变量。（4分）引入的方式就是以虚拟变量的形式引入。（1分）
46．直接用最小二乘法估计有限分布滞后模型的有：
（1）损失自由度（2分）
（2）产生多重共线性（2分）
（3）滞后长度难确定的问题（1分）
47．因变量受其自身或其他经济变量前期水平的影响，称为滞后现象。其原因包括：（1）经济变量自身的原因；（2分）（2）决策者心理上的原因（1分）；（3）技术上的原因（1分）；（4）制度的原因（1分）。
48．koyck模型的特点包括：（1）模型中的λ称为分布滞后衰退率，λ越小，衰退速度越快（2分）；（2）
模型的长期影响乘数为b0?1??（1分）;（3）模型仅包括两个解释变量，避免了多重共线性（1分）；
（4）模型仅有三个参数，解释了无限分布滞后模型因包含无限个参数无法估计的问题（1分）
49．联立方程模型中方程有：行为方程式（1分）；技术方程式（1分）；制度方程式（1分）；平衡方程（或均衡条件）（1分）；定义方程（或恒等式）（1分）。
50．联立方程的变量主要包括内生变量（2分）、外生变量（2分）和前定变量（1分）。
51．模型的识别有恰好识别（2分）、过渡识别（2分）和不可识别（1分）三种。
52. 识别的条件条件包括阶条件和秩条件。阶条件是指，如果一个方程能被识别，那么这个方程不包含的变量总数应大于或等于模型系统中方程个数减1（3分）；秩条件是指，在一个具有K个方程的模型系统中，任何一个方程被识别的充分必要条件是：所有不包含在这个方程中变量的参数的秩为K－1（2分）。
五、计算分析题（每小题10分）
1、答：（1）（2分）散点图如下： 700
（2）rXY?(X?)(Y?)
?=0.9321（3分）（3）截距项81.72表示当美元兑日元的汇率为0时日本的汽车出口量，这个数据没有实际意义；（2分）斜率项3.65表示汽车出口量与美元兑换日元的汇率正相关，当美元兑换日元的汇率每上升1元，会引起日本汽车出口量上升3.65万辆。（3分）
2、答：（1）系数的符号是正确的，政府债券的价格与利率是负相关关系，利率的上升会引起政府债券价格的下降。（2分）
?代表的是给定X的条件下Y的期望值，即Y??E(Y/X)。此模型是根（2）Yi代表的是样本值，而Yiiiiii
?而不是Y。（3分）据样本数据得出的回归结果，左边应当是Yi的期望值，因此是Yii
（3）没有遗漏，因为这是根据样本做出的回归结果，并不是理论模型。（2分）
（4）截距项101.4表示在X取0时Y的水平，本例中它没有实际意义；斜率项-4.78表明利率X每上升一个百分点，引起政府债券价格Y降低478美元。（3分）
3、答：（1）提出原假设H0：??0，H1：??0。由于t统计量＝18.7，临界值t0.025(17)?2.1098，由于18.7&2.1098，故拒绝原假设H0：??0，即认为参数?是显著的。（3分）
??0.81????0.0433。（3分）（2）由于t?，故sb(?)??)t18.7sb(?
（3）回归模型R2=0.81，表明拟合优度较高，解释变量对被解释变量的解释能力为81%，即收入对消费的 136
包含总结汇报、外语学习、专业文献、办公文档、文档下载、行业论文、应用文书、IT计算机、旅游景点、教程攻略、计划方案以及计量经济学试卷与答案等内容。本文共50页
相关内容搜索

计量模型，剔除完全不可能结构方程模型的样本量点，结果会怎么样

我要回帖

更多关于剔除样本异常值的文章

随机推荐

计量模型，剔除完全不可能结构方程模型的样本量点，结果会怎么样

我要回帖

更多关于 剔除样本异常值 的文章

随机推荐

更多关于剔除样本异常值的文章