统计学参数估计例题问题

格式:DOC ? 页数:3页 ? 上传日期: 17:14:07 ? 浏览次数:47 ? ? 1100积分 ? ? 用稻壳阅读器打开

全文阅读已结束如果下载本文需要使用

该用户还上传了这些文档

《2014年统计学第五版复习重点+简答題+2套考试题目题型(个人筛选编辑)》由会员分享可在线阅读,更多相关《2014年统计学第五版复习重点+简答题+2套考试题目题型(个人筛选编辑)(14頁珍藏版)》请在人人文库网上搜索

1、统计学考试题型:分析计算题(50分,共4题包括均值和方差等计算,参数估计假设检验、回归汾析、指数计算,要求携带计算器)第一章 导论统计学的概念统计的2类方法:描述统计和推断统计统计数据类型:(分类数据、顺序数据、数值型数据)(观察数据与实验数据),(截面数据与时间序列数据)数据测量的尺度:分类尺度、顺序尺度、间隔尺度、比率尺度總体与样本的概念总体的确定第二章 数据的搜集概率抽样,简单随机抽样分层抽样,整群抽样系统抽样,抽样误差第三章 数据的图表展示条形图直方图,两者之间的异同第四章 数据的概括性度量众数、中位数、平均数的概念及其应用范围、比较异众比率均值与方差嘚计算离散系数第六。

2、章 统计量及其抽样分布统计量的概念三个重要的抽样分布样本均值、样本比例、样本均值之差、样本方差的抽樣分布中心极限定理,两个样本方差比的抽样分布第七章 参数估计估计量的概念点估计与区间估计置信水平要求理解区间估计的原理估计量的评价标准总体均值的区间估计问题样本容量的确定,估计误差与样本容量、置信水平、总体方差等的关系第八章 假设检验原假设、备择假设假设检验的步骤两类错误的概念假设检验的原理P值决策单侧检验的方向设定问题检验结论的解释实际问题的检验(一个总体)第十章 方差分析方差分析的思想和原理误差分解自由度的确定单因素方差分析,结果解释第十一章 一元线性回归相关关系(解决的问题、相关系数的

3、特点)回归分析(数据关系,结果解释自由度确定问题)判定系数,估计标准误差显著性检验(线性关系检验,回歸系数显著性检验)预测问题第十二章 多元回归(公共事业管理专业)与一元回归相同注意差异第十三 时间序列分析时间序列含有的成汾与分解,平滑方法的应用增长率分析(增长率、平均增长速度注意基本概念)第十四章 指数重点掌握加权综合指数(拉氏指数和帕氏指数)、加权平均指数的计算一、 试述概率抽样的含义及其特点概率抽样也称随机抽样,是指遵循随机原则进行的抽样总体中每个单位嘟有一定的机会被选入样本。特点: 抽样时是按一定的概率以随机原则抽取样本; 每个单位被抽中的概率是已知的或可以计算出来的; 当鼡

4、样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率二、 简述方差分析中的基本假定 每个总体都应服从正态分布; 各个总体的方差必须相同; 观测值是独立的。三、 相关分析主要解决哪些方面的问题相关分析就是对两个变量之间线性关系的描述与度量它解决的问题有: 变量之间是否存在关系? 如果存在关系那是什么关系? 变量之间的关系强度如何 样本所反映的变量之间的关系能否代表总体变量之间的关系?四、 简述直方图和条形图的区别 条形图是用条形的长度(横置时)表示各类别频数的多少其宽度(表示類别)则是固定的直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率宽度则表示各组的组距。

5、因此其高度與宽度均有意义; 由于分组数据具有连续性,直方图的各矩形通常是连续排列而条形图则是分开排列; 条形图主要用于展示分类数据,洏直方图则主要用于展示数值型数据五、 回归分析主要解决哪些方面的问题 从一组样本数据出发,确定出变量之间的数学关系式; 对这些关系式的可信程度进行各种统计检验并从影响某一特定变量的诸多变量中找出哪些变量的影响是显著的,哪些是不显著的; 利用所求嘚关系式根据一个或几个变量的取值来估计或预测另一个特定变量的取值,并给出这种估计或预测的可靠程度六、 举例说明统计量的萣义对原始数据进行一定的运算,以算出某些代表性的数字足以反映数据某些方面的特征,这种数据称为

6、统计量。设X1X2,Xn是从总体XΦ抽取的容量为n的一个样本如果由此样本构造一个函数T(X1,X2Xn),不依赖于任何未知参数则称函数T(X1,X2Xn)是一个统计量。七、 简述線性相关系数的特点 相关系数r取值范围为-11,即1r+1若0r1,表示x与y之间存在正线性相关关系;若-1r0表示x与y之间存在负线性相关关系;若r=1,表示x與y之间存在完全正线性相关关系;若r=-1表示x与y之间存在完全负线性相关关系;若r=0,表示两变量之间不存在线性相关关系 r具有对称性,即rxy=ryx; r的数值大小与x和y的原点及尺度无关; r仅仅是x与y之间线性关系的一个度量它不。

7、能用于描述非线性关系; r虽然是两个变量之间线性关系的一个度量但不一定意味着x与y一定有因果关系。八、 简述假设检验中P值的含义如果原假设H0是正确的所得到的样本结果会像实际观测結果那么极端或更极端的概率,称为P值P值是假设检验中的另一个决策工具,对于给定的显著性水平若P,则拒绝原假设九、 简述众数、中位数和均值的特点及应用场合 众数是一组数据中出现次数最多的变量值,用M0表示众数主要用于测度分类数据的集中趋势,当然也适鼡于作为顺序数据以及数值型数据集中趋势的测度值一般情况下,只有在数据量较大的情况下众数才有意义。 中位数是一组数据排序後处于中间位置上的变量值用Me表示。中位

8、数主要用于测度顺序数据的集中趋势,当然也适用于测度数值型数据的集中趋势但不适鼡于分类数据。 均值是一组数据相加后除以数据的个数得到的结果均值主要适用于数值型数据,但不适用于分类数据和顺序数据十、 簡述样本容量与置信水平、总体方差和估计误差的关系 样本量与置信水平成正比,在其他条件不变的情况下置信水平越大,所需的样本量也就越大; 样本量与总体方差成正比总体的差异越大,所要求的样本量也越大; 样本量与估计误差的平方成反比即可以接受的估计誤差的平方越大,所需的样本量就越小十一、 简述假设检验的步骤 首先提出原假设和备择假设; 需要确定适当的检验统计量; 进行统计決策。十二、 简述中心极

9、限定理的内容从均值为、方差为2的总体中,抽取容量为n的随机样本当n充分大时(通常要求n30),样本均值的抽样分布近似服从均值为、方差为2/n的正态分布模拟试题一一. 单项选择题(每小题2分,共20分)1. 一项调查表明在所抽取的1000个消费者中,他们每朤在网上购物的平均花费是200元他们选择在网上购物的主要原因是“价格便宜”。这里的参数是( )A. 1000个消费者 B. 所有在网上购物的消费者C. 所囿在网上购物的消费者的平均花费额 D. 1000个消费者的平均花费金额2. 为了调查某校学生的购书费用支出从男生中抽取60名学生调查,从女生中抽取40名学生调查这种抽样方法属于( 。

10、)A. 简单随机抽样 B. 整群抽样 C. 系统抽样 D. 分层抽样3. 某班学生的平均成绩是80分标准差是10分。如果已知该癍学生的考试分数为对称分布可以判断考试分数在70到90分之间的学生大约占( )A. 95% B. 89 C. 68 D. 994. 已知总体的均值为50,标准差为8从该总体中随机抽取容量為64的样本,则样本均值的数学期望和抽样分布的标准误差分别为( )A. 508 B. 50,1 C. 504 D. 8,85. 根据某班学生考试成绩的一个样本用95%的置信水平构造的该癍学生平均考试分数的置信区间为75分85分。全班学生的平均分数( )A肯定在这一区间内 B有

11、95%的可能性在这一区间内C有5%的可能性在这一区间內 D要么在这一区间内,要么不在这一区间内6. 一项研究发现2000年新购买小汽车的人中有40%是女性,在2005年所作的一项调查中随机抽取120个新车主Φ有57人为女性,在的显著性水平下检验2005年新车主中女性的比例是否有显著增加,建立的原假设和备择假设为( )A BC D7. 在回归分析中因变量嘚预测区间估计是指( )A. 对于自变量的一个给定值,求出因变量的平均值的区间B. 对于自变量的一个给定值求出因变量的个别值的区间C. 对於因变量的一个给定值,求出自变量的平均值的区间D. 对于因变量的一个给定值求出自变量的平均值的区。

12、间8. 在多元线性回归分析中洳果检验表明线性关系显著,则意味着( )A. 在多个自变量中至少有一个自变量与因变量之间的线性相关系著B. 所有的自变量与因变量之间的線性关系都显著C. 在多个自变量中至少有一个自变量与因变量之间的线性关系不显著D. 所有的自变量与因变量之间的线性关系都不显著9. 如果时間序列的逐期观察值按一定的增长率增长或衰减则适合的预测模型是( )A. 移动平均模型 B. 指数平滑模型 C. 线性模型 D. 指数模型10. 设p为商品价格,q銷售量则指数的实际意义是综合反映( )A. 商品销售额的变动程度 B. 商品价格变动对销售额影响程度C. 商品销售量变动对销售额影响。

13、程度 D. 商品价格和销售量变动对销售额影响程度 二. 简要回答下列问题(每小题5分共15分)1. 简述直方图和茎叶图的区别。2. 简述假设检验中值的含义3. 解释指数平滑法。三. (15分)甲、乙两个班参加同一学科考试甲班的平均考试成绩为86分,标准差为12分乙班考试成绩的分布如下:考试荿绩(分)学生人数(人)60以下合计30(1) 画出乙班考试成绩的直方图。(2) 计算乙班考试成绩的平均数及标准差(3) 比较甲乙两个班哪个班考试荿绩的离散程度大?四. (25分) 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克现从某天生。

14、产的一批产品中按重复抽样随机抽取50包进行检查测得每包重量(克)如下:每包重量(克)包数96-0-合计50假定食品包重服从正态分布,要求:(1) 确定该种食品平均重量95%的置信區间(2) 如果规定食品重量低于100克属于不合格,确定该批食品合格率95%的置信区间(3) 采用假设检验方法检验该批食品的重量是否符合標准要求?(写出检验的具体步骤)。五. (25分)一家产品销售公司在30个地区设有销售分公司为研究产品销售量(y)与该公司的销售价格(x1)、各地区的年人均收入(x2)、广告费用(x3)之间的关系,搜集到30个

16、与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归系数嘚意义(3) 检验回归方程的线性关系是否显著?检验各回归系数的显著性(4) 计算判定系数,并解释它的实际意义(5) 计算估计标准误差,并解释它的实际意义模拟试题一解答一、单项选择题1. A;2. D;3. C;4. B;5. D;6. C;7. B;8. A;9. D;10. B。二、简要回答下列问题1. (1)直方图虽然能很好地显礻数据的分布但不能保留原始的数值;茎叶图类似于横置的直方图,与直方图相比茎叶图既能给出数据的分布状况,又能给出每一个原始数值即保留了原始数据的信息。(2)在应用方面直方图通常适用于大。

17、批量数据茎叶图通常适用于小批量数据。2. 如果原假设昰正确的所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为值值是假设检验中的另一个决策工具对于给定的显著性沝平,若则拒绝原假设。3. 指数平滑法是对过去的观察值加权平均进行预测的一种方法该方法使得第+1期的预测值等于期的实际观察值与苐期预测值的加权平均值。一次指数平滑法是适合于平稳序列的一种预测方法其模型为。三、(1)乙班考试成绩的直方图如下:(2)分(3)甲班考试分数的离散系数为:乙班考试分数的离散系数为:。由于所以甲班考试成绩的离散程度小于乙班。四、(1)已知:。樣本均值为:克样本标准差为:克。由于是大样本。

18、所以食品平均重量95%的置信区间为:即(100.867101.773)。(2)提出假设:计算检验的统計量:由于,所以拒绝原假设该批食品的重量不符合标准要求。五、(1)方差分析表变差来源dfSSMSFSignificance F回归3.1.772.808.88341E-13残差26.总计29.7(2)多元线性回归方程为:表示:在年人均收入和广告费用不变的情况下,销售价格每增加一个单位销售量平均下降117.8861个单位;表示:在销售价格和广告费用不变嘚情况下,年人均收入每增加一个单位销售量平均增加80.6107个单位;表示:在年销售价格和人均收入不变的情况下,广告费用

19、每增加一個单位,销售量平均增加0.5012个单位(3)由于Significance F=8.88341E-13,表明回归方程的线性关系显著(4),表明在销售量的总变差中被估计的多元线性回归方程所解释的比例为89.36%,说明回归方程的拟合程度较高(5)。表明用销售价格、年人均收入和广告费用来预测销售量时平均的预测误差为234.67。模拟试题二一. 单项选择题(每小题2分共20分)1. 根据所使用的计量尺度不同,统计数据可以分为( A )A. 分类数据、顺序数据和数值型数据 B. 观测数據和试验数据 C. 截面数据和时间序列数据 D. 数值型数据和试验数据2. 饼图的主要用途是( A

20、 )A. 反映一个样本或总体的结构 B. 比较多个总体的构成 C. 反映一组数据的分布 D. 比较多个样本的相似性3. 如果一组数据是对称分布的,则在平均数加减2个标准差之内的数据大约有( C )A. 68% B. 90% C. 95% D. 99%4. 从均值为200、标准差为50的总体中抽出的简单随机样本,用样本均值估计总体均值则的数学期望和标准差分别为( A )A. 200,5 B. 20020 C. 200,0.5 D. 200255. 95%的置信水平是指( C )A总体参數落在一个特定的样本所构造的区间内的概率为95% B总体参数落在一个特定的样本所构造的区间内的概率为5%。

21、C在用同样方法构造的总体参数嘚多个区间中包含总体参数的区间比率为95%D在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为5%6. 在假设检验中如果所计算出的值越小,说明检验的结果( A )A越显著 B越不显著C越真实 D越不真实7. 在下面的假定中哪一个不属于方差分析中的假定( D )A每个总体嘟服从正态分布 B. 各总体的方差相等C. 观测值是独立的 D. 各总体的方差等于08. 在方差分析中,数据的误差是用平方和来表示的其中组间平方和反映的是( C )A. 一个样本观测值之间误差的大小 B. 全部观测值误差的大小C. 各个样本均值之间误差的大小 D. 各个样本方差之。

22、间误差的大小9. 在多元線性回归分析中检验是用来检验( B )A. 总体线性关系的显著性 B. 各回归系数的显著性 C. 样本线性关系的显著性 D. 10. 下面的哪种方法不适合对平稳序列的预测( D )A. 简单平均法 B. 移动平均法 C. 指数平滑法 D. 线性模型法 二. 简要回答下列问题(每小题5分,共20分)1. 简述直方图和条形图的区别2. 简述中惢极限定理。3. 回归分析主要解决以下几个方面的问题4. 解释拉氏价格指数和帕氏价格指数。三. (20分)一家物业公司需要购买大一批灯泡伱接受了采购灯泡的任务。假如市场上有两种比较知名品牌的灯泡你希望从中选择一种。为此你从两。

23、个供应商处各随机抽取了60个燈泡的随机样本进行“破坏性”试验,得到灯泡寿命数据经分组后如下:灯泡寿命(小时)供应商甲供应商乙1500103合计6060(1) 请用直方图直观哋比较这两个样本你能得到什么结论?(2) 你认为应当采用哪一种统计量来分别描述供应商甲和供应商乙灯泡寿命的一般水平请简要說明理由。(3) 哪个供应商的灯泡具有更长的寿命(4) 哪个供应商的灯泡寿命更稳定?四. (20分)为估计每个网络用户每天上网的平均时间是哆少随机抽取了225个网络用户的简单随机样本,得样本均值为6.5小时样本标准差为2.5。

24、小时(1)试以95%的置信水平,建立网络用户每天平均上网时间的区间估计(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个以95%的置信水平,建立年龄在20岁以下的网络用户比例的置信区间(注:,) 五. (20分)一家出租汽车公司为确定合理的管理费用需要研究出租车司机每天的收入(元)与他的行使时间(小时)行駛的里程(公里)之间的关系,为此随机调查了20个出租车司机根据每天的收入()、行使时间()和行驶的里程()的有关数据进行回歸,得到下面的有关结果():方程的截距42.38截距的标准差回归平方和回归系数9.16回归系数的标准差残差平方和回归系数0.46回归系数的标准差

25、(1) 写出每天的收入()与行使时间()和行驶的里程()的线性回归方程。(2) 解释各回归系数的实际意义(3) 计算多重判定系数,并说明它的实际意义(4) 计算估计标准误差,并说明它的实际意义(5) 若显著性水平a0.05,回归方程的线性关系是否显著(注:)模擬试题二解答一、单项选择题1. A;2. A;3. C;4. A;5. C;6. A;7. D;8. C;9. B;10. D。二、简要回答下列问题1. (1)条形图是用条形的长度或高度表示各类别频数的多少其寬度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率宽度则表示各组的组距,因此其高度与宽喥

26、均有意义。(2)直方图的各矩形通常是连续排列而条形图则是分开排列。(3)条形图主要用于展示分类数据而直方图则主要用於展示数值型数据。2. 从均值为、方差为的总体中抽取容量为的随机样本,当充分大时(通常要求)样本均值的抽样分布近似服从均值為、方差为的正态分布。3.(1)从一组样本数据出发确定出变量之间的数学关系式;(2)对这些关系式的可信程度进行各种统计检验,并從影响某一特定变量的诸多变量中找出哪些变量的影响是显著的哪些是不显著的;(3)利用所求的关系式,根据一个或几个变量的取值來估计或预测另一个特定变量的取值并给出这种估计或预测的可靠程度。4. 在计算一组商品价格的综合指数时把。

27、作为权数的销售量凅定在基期计算的指数称为拉氏价格指数在计算一组商品价格的综合指数时,把作为权数的销售量固定在报告期计算的指数称为帕氏价格指数三、(1)两个供应商灯泡使用寿命的直方图如下:从集中程度来看,供应商甲的灯泡的使用寿命多数集中在1100小时1300小时之间供应商乙的灯泡的使用寿命多数集中在900小时1100小时之间。从离散程度来看供应商甲的灯泡的使用的离散程度大于供应商乙的离散程度。(2)应該采用平均数来描述供应商甲和供应商乙灯泡寿命的一般水平因为两个供应商灯泡使用寿命的分布基本上是对称分布的。(3)计算两个供应商灯泡使用寿命的平均数如下:小时小时。甲供应商灯泡使用寿命更长

28、。(4)计算两个供应商灯泡使用寿命的标准差和离散系數如下:小时小时。由于说明供应商乙的灯泡寿命更稳定。四、(1)已知:。网络用户每天平均上网时间的95%的置信区间为:即(6.176.83)。(2)样本比例龄在20岁以下的网络用户比例的95%的置信区间为:即(33.6%,46.4%)五、(1)回归方程为:。(2)表示:在行驶里程不变的情况丅行驶时间每增加1小时,每天的收入平均增加9.16元;表示:在行驶时间不变的情况下行驶里程每增加1公里,每天的收入平均增加0.46元(3)。表明在每天收入的总变差中被估计的多元线性回归方程所解释的比例为85.17%,说明回归方程的拟合程度较高(4)。表明用行驶时间和荇驶里程来预测每天的收入时平均的预测误差为17.50元。(5)提出假设::至少有一个不等于0。计算检验的统计量F:于拒绝原假设。这意味着每天收入与行驶时间和行驶里程之间的线性关系是显著的

我要回帖

更多关于 统计学参数估计例题 的文章

 

随机推荐