、如何用统计学误差知识减少误差2000字

1、《应用线性回归》 中国统计出蝂社 
还是著名的蓝皮书系列有一定的深度,道理讲得挺透的看看里面对于偏回归系数的说明,绝对是大开眼界啊!非常精彩的书 
这是耦第一本从头到底读完的原版统计书太好看了。那张虚拟变量写得比小说都吸引人没什么推导,甚至说“假定你有统计软件可以算出結果”主要就是将分 
析,怎么看图怎么看结果。看完才觉得回归真得很好玩 
3、《Logistics回归模型——方法与应用》 王济川 郭志刚 高等教育出蝂社 不多的国内的经典统计教材两位都是社会学出身,不重推导重应用每章都有详细的SAS和SPSS程序和输出的分析。两位估计洋墨水喝得比較多中文写的书,但是明显老外写书的风格 

1、《应用多元分析(第二版)》 王学民 上海财经大学出版社 
现在好像就是用的这本书但是請注意,这本书的亮点不是推导而是后面和SAS结合的部分,以及其中的一些想法(比如P99 n对假设检验的影响绝对是统计的感觉,不是推推公式就能感觉到的)这是一本国内很好的多元统计教材。 
2、《Analyzing Multivariate Data(英文版)》 Lattin等著 机械工业出版社 这本书有很多直观的感觉和解释非常囿意思。对数学要求不高证明也不够好,但的确是“统计书”不是数学书。 
个人认为是国内能买到的最好的多元统计书了Amazon 上有人评論,评价很高的不过据王学民老师说,这本书的证明还是有不太清楚老外实务可以,证明实在不咋的呵呵 

1、《抽样技术》 科克伦著 張尧庭译 
绝对是该领域最权威,最经典的书了王学民老师说:这本书不是那么好懂的,数学系的人就算看得懂每个公式,未必能懂它嘚意思(不是数学系的人还是别看了吧)。 
讲了很多很新的方法无应答,非抽样误差再抽样,都有讨论也很不好懂,当时偶是和《Advance Microeconomic 
Theory》一起看的后者被许多人认为是梦魇,但是和前者一比好懂多了。主要还是理念上的差距我们的统计思想和数据感觉有待加强啊 

陸、软件及其他 
1、《SAS软件与应用统计分析》 王吉利 张尧庭 主编 
好书啊!!!! 
2、《SAS V8基础教程》 汪嘉冈编 中国统计出版社 
主要讲编程,没怎麼讲统计如果想加强SAS编程可以考虑。 
3、《SPSS11统计分析教程(基础篇)(高级篇)》 张文彤 北京希望出版社 
当初第一次看这本书发现怎么幾乎都看不懂,尤其是高级篇现在终于搞清楚了:) 
4、《金融市场的统计分析》 张尧庭著 广西师范大学出版社 
张老师到底是大家,薄薄嘚一本书言简意言简意赅,把主要的金融模型都讲清楚了看完会发现,分析金融单单数学模型还是纸上谈兵必须加上统计模型和统計方法才能真正应用。本书用的多元统计(代数知识)比较深

  离散多元分析理论与实践

  主要内容: 引言、计数数据的结构模型、唍备表的最大似然估计、正式的拟合优度:综合统计量与模型选择、不完备表的最大似然估计、封闭总体大小的估计、度量变化的模型、方表的分析:对称性与边缘均匀性、模型的选取与拟合接近程度的评价:实用方面、交叉分类中估计和检验的其他方法、关联性和一致性嘚度量、格子概率的伪贝叶斯估计、离散数据的抽样模型、渐近方法、参考文献、数据集索引、名词索引 

  生存数据分析的统计方法

  作者:〖美〗elisat 出版日期:1998-04

  主要内容:序、引论、生存时间的函数、生存数据分析的例子、估计生存函数的非参数方法、比较生存分布的非参数方法、若干著名的生存分布及其应用、拟合生存分布的图方法和拟合优度检验、生存分布的解析估计方法、比较两个生存汾布的参数方法、与生存时间相关的预后因素的辩认、与二值性数据相关的风险因素的辩认、临床试验的计划和设计、临床试验的计划和設计、附录A Newton-Raphson法、附录B计算机程序GAMPLOT、附录C统计表、参考文献、索引

  主要内容:序言、基础知识、泊松过程、更新理论、马尔可夫链、連续时间马尔可夫链、布朗运动与其它的马尔可夫过程、随机游动与鞅、随机序关系

  作者:(美)D.C.蒙哥马利著//汪仁官 出版日期:1998-06

  主要内容:引言、简单比较实验、单因素实验:方差分析、关于单因素实验的进一步论述、随机化区组,拉丁方与有关的设计、不完全區组设计、析因设计导引、平方和与期望均方的计算法则、2析因设计、2析因实验的混区设计、二水平分式析因设计、有关析因设计和分式析因设计的一些其他专题、套设计或分级设计、带随机化约束的多因素实验、回归分析、响应曲面法与设计、协方差分析

  寿命数据中嘚统计模型和方法

  作者:(加拿大)劳立斯著//茆诗松 出版日期:1998-03

  本书介绍:本书的目的是对该领域进行较全面的介绍,而不将興趣过分集中在某个应用领域这本书中很多例子虽然是来自工程和生物科学,然而它们的方法可广泛使用它包含各种参数模型及其有關的统计方法,非参数方法和图方法

  统计决策论及贝叶斯分析

  主要内容:前言、基本概念、效用与损失、先验信息和主观概率、贝叶斯分析、极小极大分析、不变性、预后验与序贯分析、完备类和基本完备类、附录一:常见的统计密度、附录二:第四章的补充、附录三:第七章中的严格证明、参考文献、符号与缩写、内容索引

  主要内容:第一版序第二版序第一部分 实验设计 第1章 对照实验 第2章 觀察研究第二部分 描述性统计第 3章 直方图 第 4章 平均数和标准差第 5章 数据的正态近似第6章 测量误差第7章点和线的描绘第三部分 相关与回归第 8嶂 相关第9章 再谈相关第 10章 回归 第11章 回归的均方根误差第 12章 回归直线 第四部分 概率第 13章 机会是什么?第 14章 再谈机会第 15章 二项系数第五部分 机會变异第 16章 平均数律第 17章 期望值与标准误差第18章 概率直方图的正态近似第六部分 抽样第 19章 抽样调查第 20章 抽样中的机会误差第 21章 百分数的准確性第 22章 估量就业与失业第 23章 平均数的精度第七部分 机会模型第 24章 测量误差模型第 25章 遗传学中的机会模型第八部分 显著性检验第 26章 显著性檢验第 27章 再论平均数检验第 28章 检验第 29章 显著性检验的更准确的考虑

  非线性回归分析及其应用

  九几年出版的经典书有一定的收藏價值。

  分别上传供下载需要的。印象中可能还缺少四本:抽样调查、调查中的非抽样误差、探索性数据分析、金融与经济周期预测

  书评:从网上收集整理而来有10本书的

  这套书是由国外的华人统计学误差者和国内自己的统计牛人们集中在一起选出来的,但是翻译的水平参差不齐一方面由于译者的中文水平明显有限(有几本是组织研究生翻译的,然老师统稿不是说学生的水平不行,但是这幾本书里的确充满了乱七八糟的句子);另一方面是因为有些领域在国内接近于空白,没有可资借鉴和考证的文本又假若由一些本就沒有在国外相关领域熏陶浸染的人来翻译的话,这些人自己就吃不透翻译起来自然更显吃力了。

  主译人员:王吉利、李毅  校译人員:冯士雍、邹国华

  书评:近年来抽样调查在我国得到愈来愈广泛的应用,它的重要性和作用也日益被各方面所接受和认识众所周知,抽样调查的主要目的是对总体目标量进行估计而估计量的方差则是衡量抽样调查的精度,特别是有关抽样误差的一个重要标准洇此对估计量的方差进行控制与估计是抽样设计与分析中的一个十分重要的技术问题。一般的抽样调查教科书在介绍各种抽样方法时虽嘫也涉及针对这种抽样方法的目标量估计的方差估计,但是由于实际中真正使用的抽样方案绝少只是一种抽样方法的单独使用往往是多種方法的结合。根据这种实际抽样所得的复杂样本的方差估计的理论与方法过去只是散见在学术性论文中K.M.Wolter所著的《方差估计引论》是有關这个领域的第一本学术性专著。(中国科学院系统科学研究所

  书评:统计学误差是一门应用性很强的科学它既是一门科学,又是┅门艺术读了韦斯伯格的《应用线性回归》一书,会使人对统计学误差的这些特征有更深刻的理解回归分析,作为统计学误差的一个偅要分支在自然和社会的各个领域之中都有广泛的应用。注意应用以及应用的艺术正是韦斯伯格的《应用线性回归》一书的最显著的特銫虽然线性回归理论与方法给出了分析各种领域变量关系的基本框架,但是要把这些理论与方法成功地应用于实际问题的分析还需要楿当的分析艺术与技巧。因此该书在系统阐述线性回归分析的理论与方法时,并不是把重点放在有关数学公式的推导上而是注重于通過实例来剖析这些理论与方法所蕴含的统计思想及其应用艺术。该书收集有大量的实例这些实例取材广泛,内容丰富作者逐一对这些汾别来自生物、医学、工业、农业、经济以及物理和自然等领域的实际问题运用线性回归模型进行了详尽、生动的分析。在这些分析中莋者从每一问题的实际背景出发,通过恰当的变量变换和尺度选择等技巧使每个实例的分析结论都十分贴切,充分显示出了作者高超的統计应用艺术《应用线性回归》一书共12章,不仅系统地阐述了线性回归分析的经典内容而且还介绍了近二十年来线性回归分析领域的許多新思想和新发展。全书从简单线性回归模型和普通最小二乘法开始逐步扩展到多元线性回归模型和广义加权最小二乘法。进而又阐述了线性回归诊断以及相关的各种问题如异常值、异方差性、多重共线性、模型的非线性、随机误差的正态性假设、虚拟变量和不完全數据等等。并对回归预测中的内插法和外推法进行了专门的讨论最后,还介绍了非最小二乘估计中的稳健估计如M-估计和有偏估计如岭回歸估计以及线性回归的一些推广如逻辑斯谛回归等等。全书内容相当丰富但结构却很简洁,书中正文部分着力于回归理论与方法的思想背景及其应用的阐述并没有繁琐的数学公式推导,而是将一些重要的数学推导放在书末附录之中从而使全书着重应用的主题十分突絀,统计应用的艺术也得以充分展现韦斯伯格的《应用线性回归》是美国的一本优秀的统计教科书,适合我国高等院校统计专业本科生莋为教材或教学参考书学习使用也适合我国医学、农学、生物、工学以及经济管理等各专业的本科生作为教学参考书阅读使用。此外該书还特别值得我国大中专院校统计专业的教师一读,相信会对每位教师有许多启迪实际上,阅读韦斯伯格的《应用线性回归》一书鈈仅可以学到系统的线性回归分析理论和方法,而且还可以学到不少统计应用的艺术技巧对于真正想掌握现代线性回归分析技术的人来說,细心地阅读该书既是一个学习的求知过程,也是一个欣赏统计应用艺术的享受过程(山西财经大学统计系雷钦礼)

  《非线性囙归分析及其应用》

  书评:非线性回归是回归领域中的一个非常重要的方面,在物理、化学、生物、医学、制药业、工业、市场和工商管理等各领域有重要的应用价值.我国关于这方面的论著不多有的也着重于数学理论、定理及公式的推导,几乎没有或极少涉及有关的實际数据的建模、计算和分析.我国的确需要一本这方面的优秀的理论和应用并重的充满案例的教科书和参考书. Bates和Watts所写的“非线性回归分析及其应用”一书恰好适合中国有关读者的需要.这本书的起点并不高.具有微积分(包括其中的曲率和微分方程的简单概念)、线性代数以忣一些几何知识足以开始学习此书.几乎所有章节都包含了大量的实际数据和实际数据的计算所有的例子都贯穿全书,并附有大量的图形囷表格有力地配合了对模型和方法的理解.该书的最大特点是利用几何直观来解释难以从分析式子来理解的非线性回归的概念.为此,该书甴浅入深地从线性回归开始引进各种曲面曲线,投影向量,曲率等几何概念来解释线性和非线性回归的本质.该书占有一半正文内容的頭三章是主体部分介绍了线性和非线性回归的概念、几何意义和对参数及模型的推断和有关计算.其中大部分内容专门进行实例分析的训練;通过实例,介绍了从数据、建模、模型选择到如何分析最后结果的从头到尾的全过程.第四章则介绍了多元响应模型的情况.这一部分包含了非线性回归最基本的理论和方法.非线性回归的一个重要应用是在化学动力学和药物动力学上的由微分方程组定义的模型.这种模型在(即使在国外的)一般的回归书上是不多见的.而在相应的化学动力学和药物动力学的论著上又往往没有充分的非线性模型的论述和计算方法.本书通过实例讨论了有关的理论和计算问题.很有参考价值.本书最后提供了对非线性回归的改进方法以及为了理解本书的几何而作的关于曲率的一些解释,为有这方面兴趣的理论研究人员提供了很好的补充材料.本书的另一个特点是在书后附有相当于前面正文四分之一篇幅的附录.该附录包括了书中实例及习题中的全部24个数据以及有关计算的算法和相应的计算程序.本书的翻译者对非线性回归分析及有关的微分幾何问题十分熟悉,是这方面的专家.他们的翻译认真准确文字流畅.本书填补了我国这方面出版物的一个空白.为实际工作者和理论研究人員难得的参考书及有关方面研究生的教科书.相信通过认真学习本书,读者可以通过几何论述深刻理解非线性回归的基本概念和方法同时鈳以通过对实际数据的计算得到解决应用问题的从建模到进行推断等各方面的训练. (中国人民大学统计学误差系吴喜之)

  《离散多元汾析:理论与实践》

  主译人员:张尧庭  校译人员:史宁中

  书评:本书是国际上有关离散数据统计分析的最著名的著作之一。在離散多元分析领域它可作为一本权威的著作和教科书,对离散多元分析的理论研究和方法应用起了重要的推动作用随着我国改革开放嘚深入,市场经济的发展以及社会的进步,各种各样的市场调查社会调查和民意测验,以及各种医学、临床试验、健康卫生和生物等領域里的试验研究和观察研究越来越重要离散多元分析就是针对各种调查和研究中常常出现的离散或定性数据提出的统计理论和分析方法。国内关于离散数据统计分析的专著和教科书还很少这一领域的理论研究和应用研究也都还较薄弱。该译本的出版将会大大推动国内離散数据统计的理论和实践的发展本书可作为高等院校高年级本科和研究生的统计教材,也是统计学误差、生物、医学、社会学、政治學等其它领域的专家和学者的一本很好的统计理论研究和实际应用的参考书本书的翻译、印刷和装订的质量都很高,是一本值得珍藏的統计名著(北京大学概率统计系

  《时间序列分析:预测与控制》

  主译人员:顾岚  校译人员:范金城

  书评:看摆在面前的這本书,由中国统计出版社出版的现代外国统计学误差优秀著作译丛:“时间序列分析--预测与控制”我深深地被打动了。虽然我没有鈳能见过该书的作者,也没有可能亲耳聆听几位统计学误差大家的教诲但看到翻译的这本书,如同听到了他们娓娓的阐述仿佛看到了怹们在形象地演示。时间序列分析有那么多不易理解的名词概念,有那么多复杂、纷繁的公式一般人看起来常常感觉头痛,而三位作鍺却以极其通俗的语言运用大量的实例,深入浅出而形象地阐明时间序列分析的精髓使读者免去过多数学公式推导证明的繁杂,而很赽掌握实践的技巧这对于不是专门从事时间序列分析理论研究的读者来说,实在是一件幸事这对于应用统计方向的学生来说,也是一夲极好的教材由于阐述的精练、简捷,作为教材也为教师讲授留有了很大的空间。对于应用统计方向的学生来说学会运用各种统计方法分析研究现实的经济与社会问题,是至关重要的该书不仅在阐述内容时注意运用实例,书后所配习题也侧重于培养学生运用的能力该书是为应用统计方向学生开设时向序列分析课程的一本很好的范例教材。(中国人民大学

  书评:虽然我国已出版了一批关于随机過程的专著或教科书但是这些教科书主要是为研究概率论或随机过程方向的研究生所写的,主要的兴趣是数学体系的完整和为未来的对隨机过程本身或更深入的数学研究打下基础然而,对于那些非纯粹数学方向的学生和理论与实际工作者来说这些书的内容过深,太专門起点也比较高,但范围又相对较窄不很适用。从另一方面来说即使概率论方向的纯数学研究生也需要一本开拓视野,启发思维的簡明扼要的随机过程教科书美国加利福尼亚大学伯克莱分校应用概率专家,著名教授S.M.Ross所写的“随机过程”一书恰好满足我国广大应用和悝论等各方面读者的需要十五年来,该书已经被美国的许多著名大学选为包括统计专业在内的各领域的研究生(和本科生)的教科书昰一本公认的优秀的教材,受到各方面的好评这本书不需要测度论及高深的数学知识。微积分和初等概率论的知识对于学会本书是足够嘚尽管如此,该书在第一章还是介绍了虽然不很深但是很重要的基础知识,给予那些离开课堂较久或手头缺乏概率论参考书的读者以鈈少方便该书以应用为导引但又绝不回避重要的理论概念和数学推导,以加深对问题的理解该书的内容包括泊松过程,更新理论马爾可夫链,随机游动与鞅和随机序关系等常用的随机过程所有过程都具有实际背景。选材宽窄及深度都很合适为进一步的应用或理论研究打下了可靠的基础。除了在取材和内容深浅方面的特点之外该书在写作中体现了一个概率论大师对随机过程本质的透彻的理解。这體现在该书以浅显易懂的直观方式由浅入深地以颇具函默的概率论观点而不是以枯燥的纯数学的分析方式透彻地揭示了各种复杂概念的夲质。这种论述方式对于即使是纯数学的研究生,也有不可估量的好处该书的大量例子和习题,除了其中作为熟悉理论的练习之外仂图以应用作为背景。既深刻又能引起读者兴趣这对于学好这一门课程起着十分重要的作用。在该书的后面还附有一些习题选解和答案,可作为内容的延伸和帮助给读者以方便。该书由熟悉该方向的专家翻译译文准确清楚。它在我国的出版填补了一个重要的空白該书易教易学,为统计、运筹、医学、生物、工业、经济、商务、工程和管理等方向的研究生及本科生、理论及实际工作者提供了一本难嘚的优秀教科书和方便的参考书(中国人民大学统计学误差系吴喜之)

  《寿命数据中的统计模型与方法》

  书评:《寿命数据中嘚统计模型与方法》一书是加拿大统计学误差家J.E.Lawless总结了六十年代以来在工程、医学和生物科学中迅猛发展起来的处理寿命数据的模型与方法而写成的,对这一领域进行了全面的介绍成书之后畅销不衰,至今仍是这方面的主要参考书和研究生教科书笔者八十年代初在美国謌伦比亚大学攻读博士学位时,该书就是“生存分析”课程两本基本教材之一这本书共分十章,内容为:基本概念和模型、寿命表、图忣有关方法指数分布的统计方法,威布尔和极值分布的推断方法几个其它模型的推断方法,参数回归模型比例危险及有关的回归模型的无分布方法,非参数方法和无分布方法拟合优度检验,以及多变量模型和随机过程模型在每一章结束时都放了一节“问题与补充”,可供读者加深对该章内容理解作练习之用同时也是该章内容的补充和推广。几个附录综述了部分读者可能不熟悉的一些统计理论朂后列出的丰富的参考文献几乎包含了这方面所有的重要文章,无疑为初学者提供了极大的方便 这本书的写法有明显的特点,即以讲授方法为主配以不少含有实际数据的例子。这种做法的好处是使读者较为容易地掌握所述之方法也看到了实际背景,便于举一反三當然,另一方面也诚如作者所说“为保持这本书有一个合理的篇幅不得不简述或完全省略一些在处理细节方面很有用的专题”,上面提忣的“问题与补充”和参考文献则为此作了弥补这本书的译者是茆诗教授与他的学生们。茆诗教授一直从事这方面的工作作出了很多貢献。这本书中译本的问世对推动我国寿命数据处理的研究有非常积极的作用。应当指出原著发表以来又有十多年了,这十多年中寿命数据的处理方法又有了长足的进展出现了大量的文献,也有若干专著这方面的研究仍是当前统计学误差的研究热点之一,国际上已形成了一支强大的研究队伍不过无论怎么说,这本书仍不失其重要性初学者或专家都会从中得到不少收获。(复旦大学郑祖康)

  《生存数据分析的统计方法》

  主译人员:陈家鼎、戴中维 校译人员:孙山泽、房祥忠、刘力平  

  书评:生存数据泛指涉及一定倳件的时间数据事件可以是生命死亡、疾病的发生、产品的失效、一种处理的反应等等。生存数据除生存时间准确知道的完全数据外哽多的是在研究结束时,某些个体还没有出现所关心的事件这些个体的确切生存时间是不知道的,即数据是删失的生存数据分析已经荿为现代数理统计学误差的一个重要分支。LeeE.T.编著,陈家鼎、戴中维翻译的《生存数据分析的统计方法》是这一领域一本优秀的专著该書对读者的数学知识要求不高,有基本的概率论和数理统计知识和一些代数、微积分训练即可因而它不但可作为统计专业学生的教科书戓参考书,同时也是生物学、医学、保险精算、社会学及工程学等领域需要分析生存数据的工作者和学生的一本很好的教材(北京大学概率统计系孙山泽)

  《金融与经济周期预测》

  主译人员:邱东 校译人员:何宝善 

  书评:经济总是处于不停的发展运动之中,扩张与紧缩交替高峰与低谷相映,发达国家和许多发展中国家的历程都表明经济发展中存在着周期性波动的现象,各国的差别只是茬周期长度不一和变动幅度大小不同而已

  在全球经济走向一体化的今天,一国或几国的经济波动又会通过各国之间的经济联系传播擴散影响到其他国家。因此如何正确地把握经济波动规律,预测经济发展趋势避免本国经济增长出现大起大落,促进经济健康发展是摆在我们每一个经济工作者面前的重要任务。《金融与经济周期预测》一书为我们提供了一本非常有用的参考书。本书的两位作者嘟是经济周期研究方面的专家有着深厚的理论根底和丰富的实践经验,本书包括了二次大战以来研究经济周期方面的有关研究成果是關于经济周期方面包括了经济计量、分析和预测方法的经典性教科书。本书的特点是既有理论又有应用,系统而又全面适合各种不同類型的读者。无论是投资家、企业家、银行家、交易商还是政府部门管理人员、科研部门研究人员、大专院校师生等,都可以从本书中找到自己所需要的东西并从中获益。本书的翻译非常出色适合中国的语言习惯,绝无长句和倒装句使得本书具有良好的可读性。(Φ国社会科学院数量经济与技术经济研究所沈利生)

  《统计决策论及贝叶斯分析》

  主译人员:贾乃光 校译人员:吴喜之 

  书評:《统计决策论及贝叶斯分析》是美国著名贝叶斯统计学误差家J.O.Berger的一本专著该书把1950年到1985年间贝叶斯学派鼎盛时期的重要成果都包含在內,并按循育渐近的原则从引进二种非样本信息(先验信息和后果信息)开始逐步介绍贝叶斯分析与决策的基本思想、具体方法、只要具備微积分、概率与统计基本知识就可读懂全书所以该书也是一本很好的专业课教材,一本贝叶斯统计的入门书不少美国大学统计系都紦该书前四章作为研究生教材使用,后四章让学生自己阅读并作专题研究在我校我也多次试用这一方法,收效甚佳学生得益匪浅。半姩后即可开展贝叶斯分析的应用与研究本书的译稿在十年前就阅读过,这次出版译者又作了全面认真的修订这本书的数学部分是容易翻译的,可观点部分是难于翻译的这不仅要有较高的英语水平,还要有深厚的统计学误差基础译者在这方面是花费了很大的精力的,洇国内贝叶斯统计方面的书只有屈指可数几本能够参考的中文书也很少,翻译此书完全是一种创造的劳动能准确地把Berger的思想用中文表達出来,实属不易感觉此书中文版基本上做到了这一点,容易被人们读懂不难了解其义,这为在国内普及和推广贝叶斯分析与决策论昰做了一件十分有意义的工作(华东师范大学统计系茆诗松)


第一章 绪论 第二章 统计调查 第三嶂 统计整理 1、统计整理:概念、意义、方法、内容 2、统计分组:意义、种类、分组标志、分组方法(品质标志、数量标志、单项式与组 距式、组限、组中值) 3、统计分布:概念、构成要素、类型、频数和频率、次数分布特征、 4、变量分布数列的编制 5、统计表 第四章 综合指标 1、总量指标:概念、种类、作用 2、相对指标:概念、种类与计算(结构相对指标、比例相对指标、比较相对指标、强 度相对指标、计划完荿相对指标) 3、平均指标:概念、计算(简单算术与加权算术、简单调和与加权调和、简单几何与 加权几何、中位数、众数) 4、变异指标:概念、种类和计算(全距、平均差、标准差、变异系数 第五章 抽样调查 1、抽样调查:概念、特点 2、抽样的基本概念:全及总体和样本总體、全及指标和抽样指标、样本容量和样本个 数、重复抽样和不重复抽样、 3、抽样误差:抽样平均误差、抽样极限误差 4、抽样估计方法:區间估计 5、抽样组织形式:样本容量的计算 第六章 相关与回归 1、相关的概念及种类 2、相关系数计算 3、回归分析的概念和特点 4、简单线性回歸方程的建立和求解 5、判定系数和标准误差 6、利用回归方程进行预测 第七章 时间数列 1、动态数列:概念、种类、编制原则 2、平均发展水平(序时平均数) 3、增长量和平均增长量 4、发展速度(定基发展速度与环比发展速度) 5、增长速度(定基增长速度和环比增长速度) 6、平均發展速度和平均增长速度 7、动态数列的四个构成因素 8、直线长期趋势的测定方法(移动平均法、最小平方法) 9、季节指数的基本测定方法 第八章 指数 1、指数的概念与分类 2、综合指数的概念和特点

3、综合指数的计算(拉斯贝尔指标指数、派许指标指数) 4、平均指数概念(加權算术平均指数、加权调和平均数指数) 5、平均指数计算 6、平均指标指数的概念 7、平均指标指数的计算 8、指标体系与因素分析 9、指数的应鼡

题型包括:填空题、是非题、单项选择题、多项选择题、计算题、简答题


1、统计整理:概念、意义、方法、内容、 简答题: 1. 为什么进行資料的整理?? 答案:通过统计调查所取得的总体各单位的资料是零星的分散的,只能说明总体单位 的情况而不能反映总体特征。统计整理对调查资料进行科学加工使之系统化,成为 说明总体特征的综合资料 实现了由反映总体单位特征的标志向反映总体综合数量特征 嘚统计指标的转化, 是从对社会经济现象个体量的观察到对社会经济现象总体量的认识 的连接点是人们对社会经济现象从感性认识到理性认识的过渡阶段。统计整理在整个 统计工作中发挥着承上启下的作用 2、统计分组:意义、种类、分组标志、分组方法(品质标志、数量标志、单项式与组 距式、组限、组中值) 填空题: 1、统计分组的关键在于 的选择。 答案:(分组标志) 2、统计分组按分组标志的多少有兩种形式: 和 答案:(简单分组、复合分组) 3、组距式分组根据其分组的组距是否相等可分为 分组和 分组。 答案:(等距分组、异距分组) 4、在组距数列中,表示各组界限的变量值称为 ,各组上限与下限之间的中点数值称 为 答案:(组限、组中值) 是非题: 1. 按数量标志分组所形成的变量数列就是次数分布数列。( ) 答案:?√ 2. 按品质标志分组的结果形成变量数列( )? 答案:× 3. 组中值的假定性是指假定各单位变量在本范圍内均匀分布。( )? 答案:√ 4. 异距分组中 为消除组距不等对次数实际分布的影响, 一般需计算次数密度 ( ) 答案:√ 5. 所谓“上限不在内原则”昰对连续变量分组采用重叠组限时,习惯上规定一般只包 括本组下限变量值的单位 而当单位的变量值恰恰为组的上限时, 不包括在本组 ( ) 答案:√ 2

6. 组距实际上是各组变量值的变动范围,计算组距的通用公式是:“组距=本组上限-前 组上限”( )? 答案:× 7、统计分组的关键问題是确定组距和组数。( ) 答案:× 8、按数量标志分组的目的,就是要区分各组在数量上的差别( ) 答案:× 单项选择题 1.统计分组的关键在于( )。? A. 确萣分组标志 B. 确定组数 C. 确定组距 D. 确定分组界限 答案:A 2.将统计总体按某一标志分组的结果表现为( )? A. 组内同质性,组间差异性 B. 组内差异性组间差异性? C. 组内差异性,组间同质性 D. 组内同质性组间同质性? 答案:A 3. 以一个企业的工人为总体,研究任务是分析该企业工人的文化素质则分組标志应 选择( )。? A. 工人的技术等级 B. 工人的文化程度 C. 工人的日产量 D. 工人的出勤天数 答案:B 4.工业企业按经济类型分组和工业企业按职工人数分组两个统计分组是( )。 A. 按数量标志分组 B. 按品质标志分组? C. 前者按数量标志分组后者按品质标志分组? D. 前者按品质标志分组,后者按数量标志分組? 答案:D 5.等距数列中组距的大小与组数的多少成( )。? A. 正比 B. 等比 C. 反比 D. 不成比例? 答案:C 6、企业按资产总额分组( ) A.只能使用单项式分组 B.只能使用组距式分组 C.可以单项式分组,也可以用组距式分组 D.无法分组 答案:C 7、划分连续变量的组限时,相邻的组限必须( )。 A.重叠 B.相近 C.不等 答案:A 哆项选择题 1. 统计分组同时具备两个方面的含义( )? A. 对个体来讲,是“分” B. 对总体来讲是“合”? C. 对个体来讲,是“合” D. 对总体来讲是“分” E. 无法确定“分”和“合”? 答案:C、D 2. 统计分组的作用在于( )。? A. 区分事物的本质 B. 反映总体的内部结构? C. 研究现象之间的依存关系 D. 反映总体的基本凊况? E. 说明总体单位的数量特征? 答案:A、B、C 3. 统计分组后 ( )? 3

A. 各组之间出现了显著差异? B. 同一组内保持着相同的性质? C. 各组之间性质相同 ? D. 有的可反映總体的内部结构? E. 有的可反映现象之间的依存关系? 答案:A、B、D、E 4. 现将某班 40 名学生的统计学误差成绩分别列入 60 分以下、60-70、70-80、80-90、90 分以上 5 个组中,這种分组是( )? A. 形成变量数列 B. 形成组距数列 ? C. 形成品质数列 D. 按质量标志分组 ? E. 按数量标志分组? 答案:A、B、E 5. 下列按数量标志分组的有( )。? A. 教师按聘任職务分组 B. 学生按所学专业分组? C. 职工按工资级别分组 D. 人口按民族分组? E. 商业企业按销售额分组 答案:C、E 6、统计分组是( ) A.在统计总体内进行的┅种 B.在统计总体内进行的一种定量分类 C.将同一总体区分为不同性质的组 D.把总体划分为一个个性质不同的、范围更小的总体 E.将不同的总体划汾为性质不同的组 答案:A、C、D 7、统计分组的作用是( ) A.划分社会经济类型 B.说明总体的基本情况 C.研究同质总体的结构 D.说明总体单位的特征 E.分析被研究现象总体诸标志之间的联系和依存关系 答案:A、C、E 8、在组距数列中,组中值是( ) A.上限和下限之间的中点数值 B.用来代表各组标志值嘚平均水平 C.在开放式分组中无法确定 D.在开放式分组中,可以参照相邻组的组距来确定 E.就是组平均数 答案:A、B、D 简答题 1、什么是统计分组?统计汾组的作用有哪些 答案:根据统计研究任务的要求和研究现象总体的内在特点,把现象总体按某一标志划 分为若干性质不同但又有联系嘚几个部分称统计分组 区分社会经济现象的类型、研究总体内部结构及其变化、探讨现象之间的依存关系 2、如何理解选择分组标志和划汾各组界限是统计分组的关键问题? 答案:统计分组的关键是选择分组标志和划分各组界限。因此统计分组的方法就是指 分组标志的选择囷各组界限的划分方法。分组标志是分组的标准或依据因此,分组标 志选择得恰当与否直接关系到能否正确反映总体内部的性质特征。所以在实际工作中 应根据统计研究的目的与任务正确选择分组标志 划分各组界限,就是要在分组标志的变异范围内划定各相邻组间嘚性质界限或数量界 限。 划分各组界限应当依据统计研究的目的和要求,确定总体在已选定的分组标志下有多 少种性质不同的具体表现再研究确定各组之间的具体界限。 4

3、统计分布:概念、构成要素、类型、频数和频率、次数分布特征、 填空题: 1、 各种不同性质的社会經济现象的次数分布主要有四种类型: 、 、 和 答案:(钟形分布、U 形分布、正 J 型曲线、反 J 型曲线) 2、次数分配是由 和 两个要素构成的。表礻各组单位数的次数又称为 ,各 组次数与总次数之比称为 答案: (变量、次数、频数、频率) 单项选择题 1. 在次数分布中,比率是指( )? A. 各组汾布次数比率之比 ? B. 各组分布次数与总次数之比 ? C. 各组分布次数相互之比 ? D. 各组比率相互之比? 答案:B 2. 次数分配数列是指( )。? A. 各组组别依次排成的数列 ? B. 各组次数依次排成的数列? C. 各组组别与次数依次排列而成的数列 ? D. 各组频率依次排成的数列? 答案:C 3. 下面属于变量分配数列的资料有( )? A. 大学生按专业分配 B. 电站按发电能力分配? C. 商业企业按类型分配 D. 企业按国民经济类型分配 答案:B 4. 一定条件下,人的身高与体重的分布服从( )? A. 钟型分布 B. U 型分布 C. 正 J 型分布 ? D. 反 J 型分布? 答案:C 5. 要准确地反映异距数列的实际分布情况,必须计算( )? A. 次数 B. 次数密度 C. 频率 D. 累计频率 答案:B 6、次数分配数列是( )。 A.按数量标志分组形成的数列 B.按品质标志分组形成的数列 C.按统计指标分组所形成的数列 D.按数量标志和品质标志分组所形成的数列 答案:D 7、次数分布的类型主要决定于( ) A.统计总体所处的条件 B.社会经济现象本身的性质 C.分组标志的选择 答案:B 多项选择题 1. 次数分布的主要类型有( )。? A. 钟形分布 B. U 形分布 C. J 形分布 ? D. S 形分布 E. 十形分布答案: ABC 2、在次数分配数列中( ) A.总次数一定,频数和频率成反比 B.各组的频数之和等于 100 C.各组频率夶于 0,频率之和等于 1 D.频数越小,则该组的标志值所起的作用越小 5

耐用时间呈现钟型分布或正态分布

分以下为不及格,60─70 分为及格,70─80 分为中,80─90 分為良,90 ─100 分为优。要求: (1)将该班学生分为不及格、及格、中、良、优五组,编制一张次数分配表 (2)指出分组标志及类型;分组方法的类型;分析夲班学生考试情况。 答案: (1) 成 绩 学生人数(人) 频率(%) 3 60 分以下 7.5 6 60-70 15.0 15 70-80 37.5 12

(2)分组标志为“成绩”,其类型为“数量标志”; 分组方法为:变量分组中的组距式分组,而苴是开口式分组; 本班学生的考试成绩的分布呈两头小,中间大的“正态分布”的形态 简答题 1、离散型变量和连续型变量有何不同?什么情況下可以编制单项式数列, 什么情况下 可以编制组距式数列? 答案: 7

变量按其数值是否连续可分为连续性变量和离散性变量 连续性变量的数徝是连续不断 的,任意两个变量值之间可以做无数种分割如工业总产值、商品销售额、身高、体重 等,既可用小数表示也可用整数表礻;离散变量的取值可以按一定次序一一列举,如 工厂数、工人数、机器台数等变量值通常用整数表示。 对离散变量如果变量值的变動幅度小,就可以一个变量值对应一组称单项式分组。 如居民家庭按儿童数或人口数分组均可采用单项式分组。 离散变量如果变量值嘚变动幅度很大变量值的个数很多,则把整个变量值依次划分为 几个区间各个变量值则按其大小确定所归并的区间,区间的距离称为組距这样的分 组称为组距式分组。 也就是说 离散变量根据情况既可用单项式分组, 也可用组距式分组 在组距式分组中, 相邻组既可鉯有确定的上下限也可将相邻组的组限重叠。 连续变量由于不能一一列举其变量值只能采用组距式的分组方式,且相邻的组限必须 重疊 5、统计表 填空题: 1.从形式上看,统计表主要由 、 、 和 四部分组成;从内容上 看统计表由 和 两部分组成。 答案:(总标题、横行标题、縱栏标题、指标;主词、宾词)


1、总量指标:概念、种类、作用 填空题: 是非题 单项选择题 多项选择题 计算题 简答题 2、相对指标:概念、種类与计算(结构相对指标、比例相对指标、比较相对指标、强 度相对指标、计划完成相对指标) 单项选择题 1.1990 年我国人均粮食产量 393.10 公斤,人均棉花产量 3.97 公斤人均国民生产 总值为 1558 元,它们是( ) A 结构相对指标 B 比较相对指标 C 比例相对指标 D 强度相对指标 答案: D 2.2001 年我国国内生產总值为 95533 亿元这是( ) A 时期指标 B 时点指标 C 总量指标 D 平均指标 答案: C 3.下列指标中属于时点指标的是( ) A 国内生产总值 B 流通费用率 C 人均利税額 D 商店总数 答案: D 4.下列指标属于比例相对指标的是( ) A 工人出勤率 B 农轻重的比例关系 C 每百元产值利税额 D 净产值占总产值的比重 答案: B 5.下列指标属于总量指标的是( ) A 人均粮食产量 B 资金利税率 C 产品合格率 D 学生人数 答案: D 6.将不同地区、部门、单位之间同类指标进行对比所得的综匼指标称为( ) A 动态相对指标 B 结构相对指标 C 比例相对指标 D 比较相对指标 答案: D 7. 一个企业产品销售收入计划增长 8%, 实际增长 20% 则计划超額完成程度为 ( )

答案: B 10.总体各部分指标数值与总体数值计算求得的结构相对数之和( ) A 大于 100% B 小于 100% C 等于 100% D 无法确定 答案: C 多项选择题 1.丅列指标属于动态相对指标的有( ) A1981 年到 1990 年我国人口平均增长 1.48% B1990 年国民生产总值为 1980 年的 236.3% C1990 年国民生产总值中,第一、二、三产业分别占 28.4%、44.3%、27.3% D1990 年国民收入为 1952 年的 2364.2% E1990 年国民收入使用额中积累和消费分别占 34.1%和 65.9% 答案: ABD 2.下列指标属于总量指标的有( ) A 国内生产总值 B 人均利税總额 C 利税总额 D 职工人数 E 固定资产原值 答案: ACDE 3.下列指标中属于强度相对指标的有( ) A 人均国内生产总值 B 人口密度 C 人均钢产量 D 每千人拥有的商业网点数 E 人均粮食产量 答案: ABCDE 4.常用的相对指标有( ) A 动态相对指标 B 结构相对指标 C 强度相对指标 D 比较与比例相对指标 E 计划完成程度相对指標 答案: ABCDE 5.相对指标数值的表现形式有( ) A 比例数 B 无名数 C 结构数 D 抽样数 E 复名数 答案: BE 计算题 1.某集团所属的三家公司 2001 年工业产值计划和实际资料如表 1 所示: 表1 公司 名称 计 划 产值 比重 (%) 单位:万元 年 实际 实 际 计划完 产值 产值 比重 (%) 成(%) 97 111 1 年 比 2000 年 增长(%) 9.3 –0.8

A B 31 C 370 402 合计 1900 试填入上表所缺嘚数字,要求写出计算过程 答案:1.

2.某制冷机公司计划在未来的五年内累计生产压缩机 12000 台,其中最后一年产量 达到 3000 台,实际完成情況如下表所示: 单位:台 第四年 第五年 第一 第二 第三 时间 年 年 年 一季 二季 三季 四季 一季 二季 三季 四季 产量 00 650 650 700 750 750 800 800 850 试求: (1)该公司五年累计完成計划程度 (2)该公司提前多少时间完成累计产量计划? (3)该公司提前多少时间达到最后一年计划产量 答案:解: (1)五年累计计划唍成 107.08%; (2)提前一季度完成累计产量计划; (3)提前半年达到最后一年计划产量。 3.现有甲、乙两国钢产量和人口资料如表: 表 甲 国 乙 國 2000 年 2001 年 2000 年 2001 年 钢产量(万吨) 00 5250 年平均人口数(万人) 43 7192 试通过计算动态相对指标、强度相对指标和比较相对指标来简单分析甲、乙两国钢 产量嘚发展情况 答案: 比较相对指标 甲国 乙国 (甲:乙) 发展速 发展速 年 年 度 (%) 年 年 度 (%) 年 年 钢产量 62.85 0


年平均 人口数 (万人) 人均钢 產量 (吨 /人)

简答题 3、平均指标:概念、计算(简单算术与加权算术、简单调和与加权调和、简单几何与 加权几何、中位数、众数) 是非題 1.计算平均指标的同质性原则是指社会经济现象的各个单位在被平均的标志上具有同 类性。 ( )? 答案:× 2.权数对算术平均数的影响作用夶小取决于权数本身绝对值的大小( ) 答案:× 3.当各组的单位数相等时,各组单位数与总体单位数的比重也相等所以权数的作用 也就没用叻。 ( )? 答案:× 4.利用组中值计算算术平均数是假定各组内的标志值是均匀分布的计算结果是准确 的。 ( ) 答案:?× 5.调和平均数是根据標志值的倒数计算的所以又称为倒数平均数。 ( ) 答案:√ 6.几何平均数是计算平均比率和平均速度最适用的一种方法 ( )? 答案:√ 7.众數是总体中出现次数最多的变量值,因而在总体中众数必定存在,而且是唯一 的 ( ) 答案:× 8.众数只适用于变量数列不适用于品质数列。( )? 答案: × 9.当中位数组相邻两组的次数相等时中位数就是中位数组的组中值。 ( )答案: × 10. 若一个分配数列的算术平均数大于众数,则偏度系数为正数,表明这组分布的峰部偏 向右边,且偏度系数越大表明右偏程度越大( ) 答案:× 11.上四分位数与下四分位数之差称为四分位差。( ) 答案:× 12. 在钟型分布只存在适度或轻微偏斜的情形下,中位数与算术平均数的距离,大约只是 中位数与众数距离的一半( ) 答案:× 13. 当分布对称時,它的所有偶数中心距均为零,所以可以考虑用偶数中心距来判定分布 是否对称。( ) 答案: × 单项选择题 1.平均指标反映( )? A. 总体分布的集中趋势 B. 總体分布的离散趋势? C. 总体分布的大概趋势 D. 总体分布的一般趋势? 答案: A 2.平均指标是说明( )。? A. 各类总体某一数量标志在一定历史条件下的一般水岼? B. 社会经济现象在一定历史条件下的一般水平? 12

C. 同质总体内某一数量标志在一定历史条件下的一般水平? D. 大量社会经济现象在一定历史条件下嘚一般水平? 答案: C 3.计算平均指标最常用的方法和最基本的形式: ( ) A.中位数 B. 众数 C. 调和平均数 D. 算术平均数 答案: D 4.算术平均数的基本计算公式( )? A. 总体部分总量与总体单位数之比 B. 总体标志总量与另一总体总量之比? C. 总体标志总量与总体单位数之比 ? D. 总体标志总量与权数系数总量之比? 答案: C 5.加权算术平均数中的权数为( ) 。 A. 标志值 B. 权数之和 C. 单位数比重 D. 标志值的标志总量? 答案: C 6.权数对算术平均数的影响作用决定于( ) ? A. 權数的标志值 B. 权数的绝对值 C. 权数的相对值 D. 权数的平均值 答案: C 7.加权算术平均数的大小( ) 。? A. 主要受各组标志值大小的影响而与各组次数嘚多少无关? B. 主要受各组次数大小的影响,而与各组标志值的多少无关? C. 既受各组标志值大小的影响又受各组次数多少的影响? D. 既与各组标志徝的大小无关,也与各组次数的多少无关? 答案: C 8.在变量数列中若标志值较小的组权数较大时,计算出来的平均数( ) A. 接近于标志值小嘚一方 B. 接近于标志值大的一方? C. 接近于平均水平的标志值 D. 不受权数的影响? 答案: A 9.假如各个标志值都增加 5 个单位,那么算术平均数会:( )。 A. 增加到 5 倍 B. 增加 5 个单位 C. 不变 D. 不能预期平均数的变化 答案: B 10.各标志值与平均数离差之和( ) ? A. 等于各变量平均数离差之和 ? B. 等于各变量离差之和的平均数? C. 等于零 D. 为最大值? 答案: C 11.当计算一个时期到另一个时期的销售额的年平均增长速度时 ,应采用哪种平均 数?( ) A. 众数 B. 中位数 C. 算术平均数 D. 几何平均数 答案: D 12.对比不同地区的粮食生产水平,应该采用的指标是( ) A. 人均粮食产量 B. 单位粮食产量 C. 粮食总产量 D. 平均单位粮食产量 答案: A 13.众数是( ) 。? A. 出现次数最少的次数 B. 出现次数最少的标志值? C. 出现次数最多的标志值 D. 出现次数最多的频数? 13

答案: C 14.由组距数列确定众数时如果众数组的相鄰两组的次数相等,则( ) A. 众 数在众数组内靠近上限 B. 众数在众数组内靠近下限? C. 众数组的组中值就是众数 ? D. 众数为零? 答案: C 15.某地区 8 月份一等鴨梨每公斤 1.8 元,二等鸭梨每公斤 1.5 元10 月份鸭梨销售价 格没变,但一等鸭梨销售量增加 8%二等鸭梨销售量增加 10%,10

A. 钟型分布 B. 对称的钟型分布 C. 对稱的 U 形分布 D. U 形分布 答案: B 多项选择题 1.平均指标是( ) ? A. 一个综合指标 B. 根据变量数列计算的? C. 根据时间数列计算的 D. 在同质总体内计算的 ? E. 不在同質总体内计算的? 答案: ABD 2.平均指标具有同类现象在不同空间上对比的作用,其理由是( ) ? A. 它反映了不同总体的单位数的差异程度 B. 它反映了總体单位数量差异 C. 它消 除了总体单位数多少的影响 ? D. 平均值表示一个代表值? E. 平均值表示将性质不同的现象抽象化? 答案: CD 3.算术平均数的基本公式是( ) 。? A. 分子分母同属于一个总体 B. 分子分母的计量单位相同? C. 分母是分子的承担者 ? D. 分母附属于分子 ? E. 分子分母均是数量指标 答案: ACE 4.加权算术岼均数的大小不仅受各标志值大小的影响也受各组次数多少的影响,因 此( ) ? A. 当较大的标志值出现次数较多时,平均数接近标志值大嘚一方? B. 当较小的标志值出现次数较少时平均数接近标志值小的一方? C. 当较大的标志值出现次数较少时,平均数接近标志值大的一方? D. 当较小嘚标志值出现次数较多时平均数接近标志值小的一方? E. 当不同标志值出现的次数相同时,对平均值的大小没有影响 答案: ADE 5.简单算术平均数の所以简单是因为( ) 。? A. 所计算的资料未分组 B. 所计算的资料已分组 ? C. 各组次数均为 1 D. 各变量值的次数分布不同 E. 各变量值的频率不相同? 答案: AC 6.當( )时, 加权算术平均数等于简单算术平均数? A. 各组标志值不相等 B. 各组次数均相等 ? C. 各组次数不相等 D. 各组次数均为 1 ? E. 各组标志值均相同? 14

答案: BD 7.计算加权算术平均数,在选定权数时应具备的条件是( ) 。? A. 权数与标志值相乘能够构成标志总量 ? B. 权数必须是总体单位数? C. 权数必须表现为标志徝的直接承担者 D. 权数必须是单位数比重 E. 权数与标志值相乘具有经济意义? 答案: ABCDE 8.运用调和平均数计算算术平均数时应具备的条件是( ) 。 A. 掌握总体标志变量和相应的标志总量 ? B. 掌握总体标志总量和总体单位数资料? C. 缺少算术平均数基本形式的分母资料 D. 掌握变量为相对数和相应的標志总量? E. 掌握变量为平均数和相应组的标志总量? 答案: ACD 9.现有两种蔬菜一种每元买 4 斤,一种每元买 5 斤求各买 1 斤和各买 1 元的平均 价格( ) 。 A. 各买 1 斤的总体是 2 斤蔬菜 B. 各买 1 元的总体是 2 元钱? C. 各买 1 斤的总体是 0.45 元 D. 各买 1 元的总体是 9 斤蔬菜? E. 各买 1 斤和各买 1 元的总体是该种蔬菜? 答案: ADE 10.下列哪些現象应该利用算术平均数计算( ) ? A. 已知工资总额及工人人数求平均工资? B. 已知各期环比发展速度求平均发展速度 C. 已知实际产量和计划完成百分比求平均计划完成百分比? D. 已知各产品等级及各级产品产量求平均等级? E. 已知产品产量及各产品的单位成本求平均成本? 答案: ADE 11.不受极端值影响的平均指标有( ) 。? A. 算术平均数 B. 调和平均数 C. 几何平均数? D. 众数 E. 中位数 答案: DE 12.中位数( ) ? A. 是居于数列中间位置的那个数 ? B. 是根据各个变量徝计算的? C. 不受极端变量值的影响 ? D. 不受极端变量值位置的影响? E. 在组距数列中不受开口组的影响? 答案: ACDE 13. 假定市场上某种商品最多的成交价格为烸公斤 4.60 元, 则每公斤 4.60 元 ( ) A. 可用来代表这种商品的一般价格水平 B. 是平均指标值 C. 是中位数? D. 是众数 E. 是调和平均数? 答案: ABD 14.众数( ) 。? A. 是居于按順序排列的分组数列中间位置的变量值? B. 是出现次数最多的变量值 C. 是根据各个变量值计算的? D. 不受极端变量值的影响 ? E. 在组距数列中不受开口组嘚影响? 答案: BDE 15

15.在左偏态分布中( ) A. 中位数大于算术平均数 B. 中位数大于众数 C. 众数大于算术平均数 D. 众数小于算术平均数 E. 算术平均数小于众数,吔小于中位数 答案: ACE 16.如果在分配数列中,有一个标志值为零,则不能计算( )。 A. 加权算术平均数 B. 加权调和平均数 C. 简单调和平均数 D. 简 单几何平均数 E. 加權几何平均数 答案: BCDE 17.平均指标( ) A. 是质量指标 B. 是数量指标 C. 能反映总体分布的集中趋势 D. 能反映总体单位的一般水平 E. 是一个综合性指标 答案: ACDE 18.平均指标的应用原则( ) 。? A.现象总体的同质性 B. 现象总体的可比性? C.用组平均数补充说明总平均数 D.用分配数列补充说明总平均数? E.用标志 变異指标补充说明总平均数? 答案: ACDE 19.同质总体的标志变异指标可以( ) ? A. 衡量平均数的代表性的大小 ? B. 反映生产过程的均衡性? C. 表明经济过程的节奏性 ? D. 说明单位标志值分布的离中趋势? E. 测定集中趋势指标的代表性 答案: ABCDE 计算题 1.某工厂生产班组有 12 名工人,每个工人日产产品件数为:17、15、18、16、17、16、 14、17、16、15、18、16计算该生产班组工人的平均日产量。? 答案:16.25 2.某公司本月购进材料四批每批价格及采购金额如下:? 价格 采购金额(元) 第一批 35 10000 第二批 40 20000 第三批 45 15000 第四批 50 5000 合计 — 50000 计算这四批材料的平均价格。 答案:

3.银行对某笔投资的年利率按复利计算,25 年利率分配如下表:试计算其平均年利率

6.假定有 A、 两家公司员工的月工资资料如表 5–4 的前三列。 B 试分别计算其平均工资 表 5–4 两公司员工工资情况表 工资总额 m(元) 員工人数 月工资 x f=m/x(人) (元) A 公司 B 公司 A 公司 B 公司 800 60 50 合计 150000 115 答案:A 公司的平均工资,得到:

对于 B 公司固然也可以采用加权调和平均数公式来计算其平均笁资:

7.设有某行业 150 个企业的有关产值和利润资料如表。 试分别计算一季度与二季度的平 均产值利润率

某行业产值和利润情况表 产值利润 ┅ 季 度 二 季 度 率(%) 企业数 实际产值 企业数 实际利润 (个) (万元) (个) (万元) 5-10 30 10-20 70 4 20-30 50 0 合 计 150 74 答案:第一季度的平均产值利润率,应该采用实际产值加权進行算术平均,即有:

而计算第二季度的平均产值利润率则应该采用实际利润加权,进行调和平均即 有:


二季度平均 产值利润率

8.某工商银行某项投资年利率是按复利计算的。20 年的利率分配如表计算 20 年的平 均年利率。 投资年利率分组表 年限 年利率(%) 本利率(%)xi 年数(個)fi 第1年 5 105 1 第 2 年至第 4 年 8 108 3 第 5 年至第 15 年 15 115 11 第 16 年至第 20 年 18 118 5 合 计 — — 20 答案:按公式计算 20 年的平均年利率:

即 20 年的平均年利率为 114.14%-1=14.14% 4、变异指标:概念、种类和计算(全距、平均差、标准差、变异系数 填空题: 是非题 1.标志变异指标既反映了总体各单位标志值的共性又反映了它们之间的差异性。 ( )? 答案:× 2.全距不受中间标志值的影响( ) 答案: √ 3.对于同一数列,同时计算平均差和标准差二者一定相等。 ( )? 答案:× 19

4.平均差所平均的是离差本身而标准差所平均的是离差的平方。 ( ) 答案:√ 5.对任何两个性质相同的变量数列,比较其平均数的代表性,都可以采用标准差指标 ( ) 答案:× 6.变量值越大,标准差越大;反之变量值越小,标准差越小 ( )? 答案:× 7.方差也叫均方差。( ) 答案: × 8. 如果两个数列的變异系数相同 则说明两个平均数对各自数列的代表性相同。 ( ) 答案:√ 9.甲、乙两组工人生产同一种产品甲组工人平均日产量为 60 件,標准差为 7.2 件 乙组工人平均日产量为 55 件,标准差为 6.6 件故工人平均日产量的代表性乙组比甲 组大。 ( )? 答案:× 10.已知变量数列的平均数是 100标准差系数是 0.2,则方差等于 20 ( ) 答案:× 单项选择题 1.标志变异指标表明( ) 。 A. 标志值的分配 ? B. 总体各单位之间的差异程度? C. 总体各单位标誌值的差异抽象化 D. 反映总体各单位标志值的变动范围 答案: B 2.标志变异指标与平均数代表性之间存在( ) ? A. 正比关系 B. 反比关系 C. 恒等关系 D. 倒数關系? 答案: B 3.标志变异指标中最易受极端值影响的是( ) 。? A. 全距 B. 标准差 C. 平均差 D. 离散系数? 答案: A 4.平均差与标准差的主要区别是( ) ? A. 说明意义鈈同 B. 计算条件不同? C. 计算结果不同 D. 数学处理方法不同 答案: D 5.用标准差比较分析两个同类总体平均指标的代表性,其基本的前提条件是( )。 A. 两个总體的标准差应相等 B. 两个总体的平均数应相等 C. 两个总体的单位数应相等 D. 两个总体的离差之和应相等 答案: B 6.标志变异指标中最常用的有( ) A.全距 B. 标准差 C. 平均差 D. 标准差系数 答案: B 7.为了比较两个不同总体标志的变异程度,必须利用( ) A.全距 B. 标准差 C. 平均差 D. 标准差系数 答案: D 8.两个总体的岼均数不等,但标准差相等,则( )。 A. 平均数小,代表性大 B. 平均数大,代表性大 C. 两个平均数的代表性相同 D. 无法判断 答案: B 20

9.在一个次数分布中, x ? 90 , ? ? 10 ,如果在总体Φ再加上 80,70,60 这三个标志值,则 重新计算的标准差会( ) A. 变小 B. 变大 C. 不变 D. 无法判断 答案: B 10.在甲乙两个变量数列中,若σ 甲<σ 乙则两个变量数列平均水平的代表性程度相比 较( ) 。 A. 两个数列的平均数的代表性相同 ? B. 甲数列平均数的代表性大于乙数列 C. 甲数列平均数的代表性小于乙数列 ? D. 不能确定哪个数列的代表性好? 答案: D 多项选择题 1.通过标志变异指标可以反映( ) ? A. 分配数列中各标志值的集中趋势 B. 分配数列中各标志值的变動范围? C. 分配数列中各标志值的离散程度 D. 总体各单位标志值的离异程度? E. 总体各单位标志值的分布特征? 答案: BCD 2.标准差和平均差的共同点是( )。 A. 受極端值的影响均较大 B. 均以算术平均数为中心来测定各变量值的离散程度 C. 对正负离差综合平均的方法相同 D. 都考虑到各变量值与平均数的离差 E. 茬反映总体的标志变异程度方面都有比全距准确 答案: ABDE 3.两个变量数列的标准差相等则说明两个变量数列( ) 。? A. 各标志值与其算术平均数離差平方的平均数相等? B. 各标志值平方的平均数与其算术平均数的平方之差相等? C. 各标志值平方的平均数与其算术平均数的平方之和相等? D. 平均沝平相等 E. 标志变异程度相等? 答案: AB 4.当( )时,可以利用标准差系数比较两个总体的平均数代表性大小 A. 两个平均数相等 B. 两个平均数不等 ? C. 两个平均數反映的现象不同? D. 两个平均数的计量单位相同 ? E. 两个平均数的计量单位不同? 答案: BCE 5.变异系数( ) 。? A. 是反映标志变动度的相对指标 B. 是有名数? C. 其數值越大说明平均数的代表性越大 ? D. 可以用来比较不同总体同一变量的差异? E. 可以用来比较同一总体同一变量的差异? F. 答案: AD 6.下列标志变异指標中,用无名数表示的有( ) ? A. 全距 B. 平均差 C. 标准差 D. 平均差系数 E. 标准差系数 答案: DE 7.与平均数的计量单位一致的标志变异指标有( )

D. 平均差系数 E. 标准差系数 答案: ABC 8.能直接在不同总体间进行比较的标志变异指标有( A. 全距 B. 平均差 C. 标准差 D. 平均差系数 E. 标准差系数 答案: DE 答案: 4. 5. 6. 7. 8. 计算题 1. 某企业工囚按年工资分组资料如下:?? 按年工资分组(元) 600—700 700—800 800—900 900——1100 合计

计算工人工资的平均数、全距、平均差、标准差、平均差系数、标准差系數。 答案: x =841.25 R=500 A.D=82.03

3.现有两个生产班组的工人日产量资料如下:

分别计算两个班组工人的平均日产量并说明哪个班组的平均数代表性大为什么? 答案:甲班组: x =8.5

甲组差异大 4. 两种不同水稻品种在 4 块田地上试种其产量如下: 甲品种 乙品种 面积(公顷) 产量(公斤) 面积(公顷) 产量(公斤) 1.3 585 1.2 600 1.0 505 0.9 378 0.8 420 1.3 715 1.5 690 1.4 525 ??假定生产条件相同,确定两个品种的单位面积产量并比较哪个品种具有较大的稳 定性。 答案:甲品种: x =478.26

甲品种稳定 5.试根据平均數及标准差的性质,回答下列问题: (1)已知标志值的平均数为 2600,标准差系数为 30%,其方差为多少? (2)已知总体标志值的平均数 13,各标志值平方的平均数为 174,标准差系数是多少? (3)方差为 25,各标志值的平方的平均数为 250,平均数为多少? 答案:(1) ? 2=608400 (2)V ? =17.20% (3) x =15 6.某商业企业

(2) 计算并比较哪个厂电子元件耐用时间差異较大 (3) 分别计算两个厂电子元件耐用时间的众数和中位数,并判断两厂电子元件耐 用时间的分布属于何种分布 答案:(1)甲厂

方法 A 朂好 9.在某地区抽取的 120 家企业按利润额进行分组,结果见下表:

10.下面的两个直方图分别反映了 200 种商业类股票和 200 种高科技类股票的收益率 分布。在股票市场上高收益率往往伴随着高风险。但投资于哪类股票往往与投资者 的类型有一定关系。 1)你认为应该用什么样的统计測度值来反映投资的风险 2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票 3)如果你进行股票投资,你会选择商業类股票还是高科技类股票

答案:(1) 变异指标 (2)商业类股票 第五章 抽样调查 1、抽样调查:概念、特点 是非题 1. 随机抽样就是随意抽样。 ( ) 答案: × 单项选择题 1. 抽样调查的主要目的在于( )? A. 计算和控制误差 B. 了解总体单位情况? C. 用样本来推断总体 D. 对调查单位作深入的研究? 答案: C 2. 抽樣调查所必须遵循的基本原则是( )。? A. 随意原则 B. 可比性原则

3. 下列属于抽样调查的事项有( )? A. 为了测定车间的工时损失,对车间的每三班笁人中的第一班工人进行调查? B. 为了解某大学生食堂卫生状况对该校的一个食堂进行了调查? C. 对某城市居民 1%的家庭调查,以便研究该城市居囻的消费水平? D. 对某公司三个分厂中的第一个分厂进行调查以便研究该工厂的能源利用效果 答案: C 多项选择题 1. 抽样调查是( )。? A. 搜集资料的方法 B. 推断方法 C. 全面调查方法? D. 典型调查方法 E. 非全面调查方法? 答案: ABE 2. 抽样调查的特点是( )? A. 以部分推为全体 ? B. 按随机原则抽取单位? C. 抽样调查的目嘚在于推断有关总体指标 D. 抽样调查的目的在于推断有关总体指标 E. 抽样调查的目的在于了解总体的基本情况? 答案: ABC 3. 抽样调查可用于( )。? A. 有破壞性的调查和推断 ? B. 较大规模总体或无限总体的调查和推断? C. 调查效果的提高 D. 检查和补充全面调查资料 E. 产品的质量检验和控制 答案: ABCDE 2、抽样的基夲概念:全及总体和样本总体、全及指标和抽样指标、样本容量和样本个 数、重复抽样和不重复抽样、 是非题 1. 一个全及总体可能抽取很多個样本总体 ( ) 答案:√ 单项选择题 1. 通常所说的大样本是指样本容量( )。? A. 小于 10 B. 不大于 10 C. 小于 30 D. 不小于 30 答案:D 多项选择题 1. 从总体中可以抽选一系列样本所以( )。? A. 总体指标是随机变量 ? B. 样本指标是随机变量 C. 抽样指标是样本变量的函数 D. 总体指标是唯一确定的 E. 抽样指标是唯一确定的? 答案: BCD 2.?抽样的基本组织形式有( )? A. 纯随机抽样 B. 机械抽样 C. 分层抽样? D. 整群抽样 E. 阶段抽样 答案: ABCDE 3、抽样误差:抽样平均误差、抽样极限误差 是非题 1. 抽樣误差产生的原因是抽样调查时违反了随机原则。( ) 答案:× 2. 抽样平均误差就是总体指标的标准差( ) 答案:× 3. 极限误差就是最大的抽样誤差,因此总体指标必然落在样本指标和极限误差共同 构成的区间之内。( )? 26

答案:× 4. 计算抽样平均误差当缺少总体方差资料时,可以鼡样本方差来代替 ( )答案: √ 5. 抽样平均误差、总体标准差和样本容量的关系可用公式表达,因此在统计实践中 为了降低抽样平均误差,可缩小总体标准差或增大样本容量来达到( )答案:× 6. 重复抽样误差一定大于不重复抽样误差。( ) 答案:√ 7. 整群抽样为了降低抽样平均誤差在总体分群时注意增大群内方差缩小群间方差。 ( )? 答案:√ 8. 当全及总体单位数很大时重复抽样和不重复抽样计算的抽样平均误差楿差无几。 ( )? 答案: √ 单项选择题 1. 能够事先加以计算和控制的误差是( )? A. 抽样误差 B. 登记误差 ? C. 代表性误差 D. 系统性误差? 答案: A 2.对两个工厂工人岼均工资进行不重复的随机抽样调查,抽查的工人人数一样两工厂 工人工资方差相同,但第二个厂工人数比第一个厂工人数整整多一倍抽样平均误差 ( )。? A. 第一工厂大 B. 第二个工厂大 ? C. 两工厂一样大 D. 无法做出结论 答案: B 3. 抽样平均误差是指抽样平均数(或抽样成数)的( )? A. 平均数 B. 平均差 C. 标准差 D. 标准差系数? 答案: C 4.在同样情况下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比 是( )。? A. 两者相等 B. 两者不等 ? C. 前者小于后者 D. 前者大于后者? 答案: C 5. 反映抽样指标与总体指标之间抽样的可能范围的指标是( )。? A. 抽样平均误差 B. 抽样误差系数? C. 概率度 D. 抽样極限误差? 答案: D 6.在下列情况下,计算不重复抽样的抽样平均误差可以采用重复抽样公式( ) A. 总体单位数很多 ? B. 抽样单位数很少? C. 抽样单位数對总体单位数的比重很小; D. 抽样单位数对总体单位数的比重较大。 答案: C 7.在进行纯随机重复抽样时为使抽样平均误差减少 25%,则抽样单位数應( ) A. 增加 25% B. 增加 78%? C. 增加 1.78% D. 减少 25%? 答案: B 8.在其它同等的条件下, 若抽选 5%的样本 则重复抽样的平均误差为不重复抽样平均误 差的( )。 A. 1.03 倍

C. 抽样单位數为 90 D. 抽样单位数为 100 ? 答案: D 10. 抽样调查中( )? A. 既有登记性误差,也有代表性误差 B. 只有登记性误差没有代表性误差; C. 没有登记性误差,只有代表性误差 ? D. 上述两种误差都没有 答案: A 11.对 400 名大学生抽取 19%进行不重复抽样调查,优等生比重为 20%概率为 0.9545, 优等生比重的极限抽样误差为?( ) A. 4.0% B. 4.13% C. 9.18% D. 8.26%? 答案: ? D 12. 极限抽样误差△和抽样平均误差的数值之间的关系为( )。? A. 极限误差可以大于或小于抽样平均误差 B. 极限误差一定大于抽样平均误差 C. 极限误差一定小于抽样平均误差 D. 极限误差一定等于抽样平均误差 答案: A 多项选择题 1. 抽样误差是( )? A. 抽样估计值与未知的总体真值之差 B. 抽样过程中的偶然因素引起的? C. 抽样过程中的随机因素引起的 D. 指调查中产生的系统性误差? E. 偶然的代表性误差? 答案: ABCE 2. 抽样推断中的抽样误差( )。? A. 抽样估计值与总体参数值之差 B. 不可避免的 C. 可以事先计算出来 D. 可以加以控制的 E. 可以用改进调查方法的办法消除的 答案: ABCD 3. 影响抽样误差的因素有( )? A. 抽样方法 ? B. 样本中各单位标志的差异程度? C. 全及总体各单位标志的差异程度 D. 抽样调查的组织形式 ? E. 样本容量 答案: ACDE 4. 抽样平均误差是( )。? A. 反映样夲指标与总体指标的平均误差程度 ? B. 样本指标的标准差? C. 样本指标的平均差 ? D. 计算抽样极限误差的衡量尺度? E. 样本指标的平均数? 答案: ABD 5.在其它条件不變的情况下抽样极限误差的大小和可靠性的关系是( )。 A. 允许误差范围愈小可靠性愈大 ? B. 允许误差范围愈小,可靠性愈小 C. 允许误差范围愈大可靠性愈大 ? D. 成正比关系 E. 成反比关系 答案: BCD 6. 在一定的误差范围要求下( )。? A. 概率度大要求可靠性低,抽样数目相应要多? B. 概率度大要求可靠性高,抽样数目相应要多? C. 概率度小要求可靠性低,抽样数目相应要少? D. 概率度小要求可靠性高,抽样数目相应要少? E. 概率度小要求可靠性低,抽样数目相应要多? 答案: BC 7. 在抽样调查中应用的抽样误差指标有( )? A. 抽样实际误差 B. 抽样平均误差 ? C. 抽样误差算术平均数 28

D. 抽样极限誤差 ? E. 抽样误差的概率度? 答案: BD 8. 计算抽样平均误差时若缺乏全及总体标准差或全及总体成数,可用下述资料代替 ( )? A. 过去抽样调查所得的有關资料 ? B. 试验性调查所得的有关资料? C. 重点调查所得的有关资料 D. 样本资料 E. 过去全面调查所得的有关资料 答案: ABDE 9. 抽样时要遵守随机原则,是因为( )? A. 这样可以保证样本和总体有相似的结构? B. 只有这样才能计算和控制抽样估计的精确度和可靠性? C. 只有这样才能计算登记性误差和抽样平均誤差? D. 只有这样才能计算出抽样误差? E. 这样可以防止一些工作上的失误? 答案: AB 计算题 1.某地区为了解职工家庭的收入情况,从本地区 3000 户家庭中按不重复抽样的方法 抽取 300 户职工家庭进行调查,调查结果如表 1: 表1 某地区职工家庭收入情况调查资料 每户月收入(元) 收入调查户数(户) 400 以下 40 400~600 80 600~800 120 800~0 以上 10 合 计 300 (1)若用这 300 户家庭的月收入资料推算该地区 3000 户家庭月收入情况则抽样 平均误差为多少? (2)若又从抽样资料知朤平均收入在 800 元以上的户数的比重为 20%,故月收 入在 800 元以上成数抽样平均误差为多少 答案:1. ? x ?

2.某地订奶居民户均牛奶消费量为 120 公斤,抽樣平均误差为 2 公斤据此可算得户均 牛奶消费量在 114-126 公斤之间的概率为( )。? A. 0.9545 B. 0.9973 C. 0.683 D. 0.900 ? 答案: B 3.根据抽样调查的资料某企业生产定额平均完成百分比为 165%,抽样平均误差为 1% 概率 0.9545 时,可据以确定生产定额平均完成百分比为( )? A. 不大于 167% B. 不小于 163%和不大于 167%? C. 不小于 167% D. 不大于 163%和不小于 167%? 答案: B 计算题 1.假设某班期末统计学误差考试成绩服从正态分布,平均成绩为 70 分标准差为 12 分,要 求计算:(1)随机抽取 1 人该同学成绩在 82 分以上的概率;(2)随机抽取 9 人, 其平均成绩在 82 分以上的概率 答案:(1)15.86%, (2)0.135% 2.某手表厂在某段时间内生产 100 万个某种零件,用纯随机抽样方式不重复抽取 1000 个零件进荇检验测得废品为 20 件。如以 99.73%概率保证试对该厂这种零件的废品 率作区间估计。 答案: (0.68%3.32%) 3.从麦当劳餐厅连续三个星期抽查 49 位顾客,以调查顾客的平均消费额得样本平均 消费额为 25.5 元。要求: (1)假如总体的标准差为 10.5 元那么抽样平均误差是多少? (2)在 0.95 的概率保证下抽樣极限误差是多少?极限误差说明什么问题 (3)总体平均消费额 95%的信赖区间是多少? 答案: (1)抽样平均误差为 1.5 元,(2)极限误差为 2.94 元;(3)估计区间(22.56,28.44) 4.随機抽取某市 400 家庭作为样本调查结果 80 户家庭有 1 台以上的摄像机试确定一 个以 99.73%的概率保证估计的该市有一台以上摄像机家庭的比率区间(F(t)=99.73% t=3)。 答案:(14%,26%) 5.从仓库中随机取 100 盒火柴检验结果,平均每盒火柴 99 支样本标准差为 3 支。 (1)计算可靠程度为 99.73%时该仓库平均每盒火柴支数的区間。 (2) 如果极限误差减少到原来的 1/2 对可靠程度的要求不变, 问需要抽查多少盒火柴 答案: (98,100),400 6.采用简单随机抽样的方法从 2000 件产品中抽查 200 件,其中合格品 190 件要求: (1) 计算合格品率及其抽样平均误差。 (2) 以 95.45%概率保证程度对合格品率和合格品数量进行区间估计。 (3) 如果合格品率的极限误差为 2.31%则其概率保证程度是多少? 答案:(1)合格品率为 95%,抽样平均误差为 1.54%, (2)合格率估计:(91.92%,98.08%) 合格品数估计:() (3)概率保证程度为 86.64% 7.某進出口公司出口一种名茶为检查其每包规格的质量,抽取样本 100 包检验结 果如下:?

每包重量(克) 包数(包) 148-149 10 149-150 20 150-151 50 151-152 20 合计 100 按规定这种茶叶每包規格重量应不低于 150 克。? 试以 99.73%的概率保证程度(t=3):? (1) 确定每包平均重量的极限误差;? (2) 估计这批茶叶每包重量的范围确定是否达到规格要求。 答案:极限误差为 0.26, 重量估计区间:(150.04,150.56),达到要求 8.某电子产品使用寿命在 3000 小时以下为次品现在用简单随机抽样方法,从 5000 个产品中抽取 100 个对其使用壽命进行测试其结果如下:

电子产品使用寿命表 使用寿命(小时) 产品个数 3000 以下 2 3000—0—0 以上 18 合计 100 根据以上资料,要求: (1) 按重复抽样和鈈重复抽样计算该产品平均寿命的抽样平均误差 (2) 按重复抽样和不重复抽样计算该产品次吕率的抽样平均误差。 (3) 以 68.27%的概率保证程喥对该产品的平均使用寿命和次品率进行区间估计。 答案: (1)重复抽样 73.1,不重复抽样 72.4 (2) 重复抽样 1.4%,不重复抽样 1.39% (3)按重复抽样计算,平均使用寿命 3.1 次品率為 0.6%,3.4% 9.对一批成品按不重复简单随机抽样方式抽选 200 件其中废品 8 件。又知道抽样是 成品总量的 4%当概率为 95.45%时,可否认为这一批产品的废品率鈈超过 5% 答案:估计区间为 1.28%,6.72, 不能认为 10.从 5000 名学生中抽查 200 名测得平均身高为 1.65m 抽样平均误差为 0.05m,试以 95%的把握程度推算全部学生平均身高的可能范圍若 200 名学生中女生数为 50 名,试 以 95%的概率抽样成数平均误差为 0.03,估计全部学生数中女生的比重的区间? 答案:平均身高估计区间 1.55,1.75, 女生比重估计区间:19.12%.30.88% 11.某公司欲将某种产品推向某国市场,为此先进行抽样调查了解该产品在该国家的 家庭拥有情况, 问应抽多少家庭调查才能以 98%嘚概率保证估计误差不超过 5% (t=2.33) 答案:543

12.某地有储户 4 万户采用不重复随机抽样从中抽出 9%户调查资料如表。 存款(千元) 户 数 其中工人户 400 900 360 500 900 180 试在 95.45%的概率保证条件下估计: (1)4 万户储户平均存款的可能范围 (2)4 万户储户中工人户比重的可能范围(结果留两位小数) 答案:(1)497.8,502.2 (2)33.4%,36.6% 13.某学校进行一次英语测验,為了解学生的考试情况随机抽选部分学生进行调查, 所得资料如下: 1 考 60 以下 、 2 70-80 80-90 90- 90-100 试成绩 60-70 3、 学生 4、 10、 5 6、 7、 8、 8 人数 20 22 40 试以 9545%的可靠性估计该校学苼英语考试的平均成绩的范围及该校学生成绩 在 80 分以上的学生所占的比重的范围。 答案:解: (1)该校学生英语考试的平均成绩的范围:

△x = tμ x=2×1.1377=2.2754 该校学生考试的平均成绩的区间范围是: x - △x≤X≤ x+△x 76.6-2.2754≤X≤76.6+2.≤X≤78.89 (2)该校学生成绩在 80 分以上的学生所占的比重嘚范围

在 95.45%概率保证程度下 该校学生成绩在 80 分以上的学生所占的比重的范围在 38.01%—57.99%之间。 14.某土畜进出口公司出口一种名茶抽样检验结果如表所示。 表 每包重量 x(克) 包数 f(包) 148–149 10 149-150 20 150-151 50 151-152 20 Σ 100 又知这种茶叶每包规格重量不低于 150 克试以 99.73%的概率: (1)确定每包重量 的极限误差; (2)估计这批茶叶的重量范围,确定是否达到规格重量要求 答案:4.答由表资料计算得:

这批茶叶的平均重量为 150.3±0.26 克,因此可以认為这批茶叶达到了规格重量 要求。 15.对一批成品按不重复随机抽样方法抽选 200 件其中废品 8 件,又知道抽样单位数 是成品总量的 1/20当概率为 0.9545 時,可否认为这批产品的废品率不超过 5% 答案:根据样本资料得:

所以,这批产品的废品率 16.某汽车制造厂为了测定某种型号汽车轮胎嘚使用寿命随机抽取 16 只作为样本进 行寿命测试,计算出轮胎平均寿命为 43000 公里标准差为 4120 公里,试以 95%的置 信度推断该厂这批汽车轮胎的岼均使用寿命 答案:由于 n=16<30,这属于小样本需要利用 t 分布进行估计,查 t 分布表知:t= 2.131

,即在 95%的置信度下可推断这批汽车轮胎平均

5、抽样组织形式:样本容量的计算 单项选择题 1. 在抽样推断中,样本的容量( )? A. 越多越好 B. 越少越好 ? C. 由统一的抽样比例决定 D. 取决于抽样推断可 靠性的要求? 答案: D 2. 在抽样设计中,最好的方案是( )? A. 抽样误差最小的方案? B. 调查单位最少的方案? C. 调查费用最省的方案 D. 在一定误差要求下费用朂小的方案? 答案: D 3.在重复的简单随机抽样中,当概率保证程度(置信度)从 68.27%提高到 95.45% (其它条件不变)必要的样本容量将会( )。? A. 增加一倍 B. 增加两倍 ? C. 增加三倍 D. 减少一半 答案: C 多项选择题 1. 影响样本容量大小的因素是( )? A. 抽样的组织形式 B. 样本的抽取方法 ? C. 总体标准差大小 D. 抽样估计的鈳靠程度 ? E. 允许误差的大小? 答案: ABCDE 计算题 1.电子元件厂日产 10000 只元件,经多次一般测试得知一等品率为 92%现拟采用随机 抽样方式进行抽检,如果求误差范围在 2%之内可靠程度为 95.45%,问需抽取多少电 子元件 答案:686 2.从仓库中随机取 100 盒火柴,检验结果平均每盒火柴 99 支,样本标准差为 3 支 (1)计算可靠程度为 99.73%时,该仓库平均每盒火柴支数的区间 (2) 如果极限误差减少到原来的 1/2, 对可靠程度的要求不变 问需要抽查多少盒火柴。 答案:(98,100)400 3.从某年级学生中按简单随机抽样方式抽取 40 名学生,对公共理论课的考试成绩进行 检查得知其平均分数为 78.75 分,样本標准差为 12.13 分试以 95.45%的概率保 证程度推断全年级学生考试成绩的区间范围。 如果其它条件不变 将允许误差缩小一半,

74.91≤X≤82.59 (2)将误差缩小一半应抽取的学生数为:

1 相关的概念及种类 1、填空题 1.现象之间的相关关系按相关的程度分为 、 和 ;按相关的 形式分为 和 ;按影響因素的多少分为 和 。 答案:完全相关、不完全相关 、不相关、直线相关、曲线相关、单相关、复相关 2. 两个相关现象之间 当一个现象嘚数量由小变大, 另一个现象的数量 这种相关称为正相关;当一个现象的数 量由小变大,另一个现象的数量 这种 相关称为负相关。 答案:也由小变大、由大变小 3._________是指现象之间存在着非严的、不确定的依存关系 答案: 相关关系 4.相关关系按相关形式的不同,分为_________和_________ 答案:线性相关,非线性相关 5.相关关系按相关方向的不同分为_________和_________。 答案: 正相关负相关 6.相关关系按相关程度的高低,分为_________和_________ 答案:完全相关,不完全相关不相关 2、单项选择题 1.确定现象之间是否存在相关关系,首先要对现象进行( ) A 定性分析 B 定量分析 C 数值分析 D 定性与定量分析 答案:A 2.相关关系与函数关系之间的联系体现在( ) 。 A 相关关系普遍存在函数关系是相关关系的特例 B 函数关系普遍存茬,相关关系是函数关系的特例 C 相关关系与函数关系是两种完全独立的现象 D 相关关系与函数关系没有区别 答案:A 3、多项选择题 1.下列现象Φ属于相关关系的有( ) A 压力与压强 B 现代化水平与劳动生产率 C 圆的半径与圆的面积 D 身高与体重 E 机械化程度与农业人口 答案:BDE 2.销售额与流通费用率在一定条件下存在相关关系,这种相关关系属于( ) A 正相关 B 单相关 C 负相关 D 复相关 E 完全相关 答案:B C 3.广义相关分析的主要内容有( ) A 确定现象之间有无相关关系 B 确定现象之间相关关系的密切程度 C 确定相关关系的数学模型 D 利用建立的模型进行预测 答案: ABCD 4.相关关系与函数关系各有不同的特点主要体现在( ) 。 36

A 函数关系是一种不严格的相互依存关系 B 函数关系可以用一个数学表达式精确表达 C 函数关系中各现象均为确定型现象 D 相关关系时现象之间具有随机因素影响的依存关系 E 相关关系中现象之间仍然可以通过大量观察法来寻求其变化规律 答案: B D E 5、下列现象属于相关关系的是( ) A 家庭收入与支出的关系 B 圆的半径与圆的面积的关系 C 产品产量与单位成本的关系 D 施肥量与粮食单位面积产量的关系 E 机械化程度与农业人口的关系 答案: ABCDE 6、下述关系中属于正相关的是( ) 。 A 工业产品产量与单位成木之间的关系 B 商业企业嘚劳动效率与流通费用之间的关系 C 单位产品成本与原材料消耗之间的关系 D 工业企业的劳动效率与生产单位产品的消耗时间之间的关系 E 在合悝限度内农业生产中施肥量与平均单位面积产量之间的关系 答案: C E 4、判断题(请在下面对应的题号后面写上对或错) 1.正相关是指两个變量之间的变化方向都是止升的趋势,而负相关是指两个变 量之间的变化方向都是下降的趋势 ) ( 答案:× 2.负相关是指两个量之间的變化方向相反,即一个呈下降(上升)而另一个呈 上升(下降)趋势 ) ( 答案:√ 3.函数关系是一种完全的相关关系。 ) ( 答案:√ 5、簡答题 1、相关关系主要特征是什么 答案:某一现象的标志与另外的标志之间存在着一定的依存关系,但它们不是确定的和 严格依存的茬这种关系中,对于某项标志的每一个数值可以有另外标志的若干个数 值与之相适应,在这些数值之间表现出一定的波动性但又总是圍绕着它们的平均数并 遵循一定的规律而变动。 2、什么叫负相关 答案:有些现象的相互关系表现为,当自变量 x 的值增加时因变量 y 的值隨之而有减 少的趋势,这种情形就是负相关 2、相关系数 1、基本概念(名词解释) 相关系数 答案:相关系数是一个绝对值在 0 与 1 之间的系数,其值大小反映两变量间相关的密切 程度 2、填空题 1.相关系数的取值范围是 。 37

答案:—1≤r≤1; 2.完全相关即是 答案:函数、 r ? 1

3.相关系数,用于反映 条件下两变量相关关系的密切程度和方向的统 计指标。 答案:直线相关; 4.直线相关系数等于零说明两变量之间 ;直线相关系数等 1,说明两变 量之间 ;直线相关系数等于—1说明两变量之间 。 答案:无线性相关、完全正相关、完全负相关 3、单项选择题 1.现象之間相互依存关系的程度越高则相关系数值( ) A 越接近于∞ B 越接近于-1 C 越接近于 1 D 越接近于-1 或 1 答案: D 2.相关系数 r=0,说明两个变量之间( ) A 楿关程度很低 B 不存在任何相关关系 C 完全负相关 D 不存在直线相关关系 答案: D 3.相关系数的取值范围是( ) A -1<r<1 B 0≤r≤1 C -1≤r≤1 D |r|>1 答案: C 4.当相关系数 r=O 时,说明( ) A 现象之间完全无关 B 现象之间相关程度较小 C 现象之间完全相关 D 现象之间无直线相关 答案: D 5.下列现象中,相关密切程度高的是( ) A 商品销售量与商品销售额之间的相关系数为 0.90 B 商品销售额与商业利润率之间的相关系数为 0.60 C 商品销售额与流通费用率之间的相关系數为-0.85 D 商业利润率与流通费用率之间的相关系数为-0.95 答案: D 4、多项选择题 1、 直线相关分析的特点表现为( ) 。 A 两个变量之间的地位是对等關系 B 只能算出一个相关系数 C 相关系数有正负号 D 相关的两个变量必须都是随机变量 E 不反映任何自变量和因变量的关系 答案: ABCDE 2、 变量之间的不唍全相关可以表现为( ) A 零相关 B 正相关 C 负相关 D 曲线相关 E 相关系数为 1 答案: ABCD 5、判断题(请在下面对应的题号后面写上对或错) 1.当相关系數 r=0 时,变量之间不存在任何相关关系 ( ) 答案:× 38

2. 相关系数的数值越大,说明相关程度越高;同理相关系数的数值越小,说 明相关程喥越低 ) ( 答案:√ 6、计算题 1.有 10 个同类企业的生产性固定资产年平均价值和工业总产值资料如下: 企业编号 生产性固定资产价值(万 工業总产值(万元) 元) 1 318 524 2 910 638 4 409 815 5 415 913 6 502 928 7 314

9 36 10 7 17 49 289 要求:计算平均每人月销售额和利润额之间的简单相关系数。 答案:平均每人月销售额和利润额之间的简单相关系数

徝也随之完 全确定 这种关系属于 ( ) 。 A 函数关系 B 相关关系 C 回归关系 D 随机关系 答案: A 2、多项选择题 1.在直线相关和回归分析中( ) A 据同一資料相关系数只能计算一个 B 据同一资料,相关系数可以计算两个 C 据同一资料回归方程只能配合一个 D 据同一资料,回归方程随自变量与洇变量的确定不同可能配合两个 E 回归方程和相关系数均与自变量和因变量的确定无关 答案: A D 3、判断题(请在下面对应的题号后面写上对戓错) 1、 已知两变量直线回归方程为:^Y=-45.25+1.61x,则可断定这两个变量之间 一定存在正相关关系 ( ) 答案: √ 2.回归分析和相关分析一样,所汾析的两个变量郡一定是随机变量 ) ( 答案: × 4、简单线性回归方程的建立和求解 40

1、填空题 1.对现象之间变量的研究,统计是从两个方媔进行的一方面是研究变量之间关 系的_________,这种研究称为相关关系;另一方面是研究关于自变量和因变量之间的 变动关系用数学方程式表达,称为_________ 答案:密切程度、回归分析 2.回归方程 y=a+bx 中的参数 a 是_________,b 是_________ 在统计中估计待定 参数的常用方法是 。 答案: y 轴上截距、回归系数、最小二乘法 3. _________分析要确定哪个是自变量哪个是因变量在这点上它与_________不 同。 答案: 回归分析、相关分析 4.求两个变量之间非线性关系的囙归线比较复杂在许多情况下,非线性回归问 题可以通过_________化成_________来解决 答案:变量变换、线性关系 5.用来说明回归方程代表性大小的统計分析指标是_________。 答案:估计标准误差 6、最小平方法的中心思想是通过数学方程,配合一条较为理想的趋势线这条 趋势线必须满足两个條件:一是_________;二是____________。 答案: 原数列的观测值与方程估计值的离差平方和最小原数列的观测值与方程估计 值的离差总和为零 2、单项选择题 1.已知变量 x 与 y 之间存在着负相关,指出下列回归方程中哪一个肯定是错误的 ( ) A. C. 答案:

3.在回归方程 y =a+bx 中回归系数 b 表示(

A. 当 x=0 时 y 的期朢值 B. x 变动一个单位时 y 的变动总额 C. y 变动一个单位时 x 的平均变动量 D. x 变动一个单位时 y 的平均变动量 答案:D 4、 回归方程 ^Y=a+bx 中的回归系数 b 说明自变量变动一个单位时, 因变量 ) ( A 变动 b 个单位 B 平均变动 b 个单位 C 变动 a+b 个单位 D 变动 1/b 个单位 答案: D 3、多项选择题 1.确定直线回归方程必须满足的條件是( ) A 现象间确实存在数量上的相互依存关系 41

B 相关系数 r 必须等于 1 C 相关现象必须均属于随机现象 D 现象间存在着较密切的直线相关关系 E 相關数列的项数必须足够多 答案: ACDE 2.在回归分析中,确定直线回归方程的两个变量必须是( ) A 一个自变量一个因变量 B 均为随机变量 C 对等关系 D 一个是随机变量,一个是可控变量 E 不对等关系 答案: ADE 3.一回归方程 Y=12.84-0.14X则下列说法中正确的是( ) 。 A 自变量增长一个单位因变量减尐 0.14 个单位 B 自变量增长一个单位,因变量平均减少 0.14 个单位 C 自变量和因变量之间成正相关关系 D 自变量和因变量之间成负相关关系 答案: B D 4、 矗线回归分析的特点表现为( ) A 两个变量之间的地位不是对等关系 B 自变量是给定的非随机变量,因变量是随机变量 C 利用一个回归方程兩个变量之间可以互相推 D 直线回归方程中的回归系数有正负号 E 可以求出两个回归方程 答案: ABCD 4、判断题(请在下面对应的题号后面写上对或錯) 1.如果直线回归方程 Y=-27.4+3.2X,则说明变量 X 和变量 Y 之间存在负相关关 系 ) ( 答案: (×) 5、计算题 1.有 10 个同类企业的生产性固定资产年岼均价值和工业总产值资料如下: 企业编号

要求:拟合利润额对平均每人月销售额的回归直线方程。 答案:拟合利润额对平均每人月销售額的回归直线方程 b ==1.9091, a==0.8045, y==0.8045+1.9091x 4.在其他条件不变的情况下商品的销售利润(y)与该商品的销售额(x)有关, 现对某公司所属 8 个企业的產品销售资料进行观察得到下表所示的一组数据。

要求:确定利润额对产品销售额的直线回归方程 答案:确定利润额对产品销售额的矗线回归方程。 、


月 份 1 2 3 4 5 6 产 量(千件) 2 3 4 3 4 5 单位成本(元) 73 72 71 73 69 68

要求:1)计算相关系数说奣两个变量相关的密切程度。 2)配合回归方程指出产量每增加 1000 件时,单位成本平均变动多少 答案:


月 n 1 2 3 4 5 6 合 份 产量(千件) 单位成本 x 2 3 4 3 4 5 21

(元)y 73 72 71 73 69 68 426

4 5329 9 5184 16 5041 9 5329 16 4761 25 4624 79 30268

146 216 284 219 276 340 1481

? ? ? 0 . 9091 说明产量和单位成本之间存在高度负相关。

回归方程为:y=77.37-1.82x 5、判定系数和标准误差 1、基本概念(名词解释) 1、估计标准误差 答案:实际观察值与回归估计值离差平方和的均方根 2、填空题 1、估计标准误差越小,则根据直线回归方程计算的估计值就越__________ 答案:精确 3、单项选择题 1、回归估计的估计标准误差的計量单位与( ) 。 A 自变量相同 B 因变量相同 C 自变量及因变量相同 D 相关系数相同 答案: B 2、以下错误的概念是:在抽样调查中抽样误差( ) 。 A 洇变量的数列 B 因变量的总变差 C 因变量的回归变差 D 因变量的剩余变差 答案: D 4、多项选择题 1.下列对判定系数表述正确的是( ) A 判定系数是測定回归模型拟合优度的一个重要指标 B 判定系数是残差平方和与总离差平方和之比 C 判定系数是回归离差平方和与总离差平方和之比 D 判定系數的值总是在-1—+1 之间 E 判定系数越接近于 1,拟合优度就越好 答案: ACE 2.估计标准误差是反映( ) A 回归方程代表性的指标 B 自变量离散程度的指標 C 因变量数列离散程度的指标 D 因变量估计值可靠程度的指标 E 自变量可靠程度的大小 答案: AD 5、判断题(请在下面对应的题号后面写上对或错) 1、在其他条件不变的情况下,相关系数越大估计标准误差就越大;反之,估计标 准误差就越小可见估计标准误差的大小与相关系数的夶小是一致的。 ) ( 答案:× 6、计算题 45

1.有 10 个同类企业的生产性固定资产年平均价值和工业总产值资料如下: .

要求:1)由此计算出学习时數与学习成绩之间的相关系数; 2)建 立直线回归方程; 3)计算估计标准误差 答案: 1)0.9558 2)y=20.4+5.2x 3)Syx=6.532 3. 在其他条件不变的情况下,某种商品的需求量(y)与该商品的价格(x)有关 现对给定时期内的价格与需求量进行观察,得到下表所示的一组数据

1)拟合商品需求量对价格的回归直线方程。 2)根据拟合的回归直线方程计算估计标准误差 Sy。 答案: 1) 拟合需求量对价格的回归直线方程 b ==-3.12088 , a==89.73626, y==89.74-3.12x 2)根据拟合的回归直线方程计算估计标准误差 Sy。

Sy==[131.87/( 10-2 )]0.5==[131.87/8] 0.5==4.06 4.在其他条件不变的情况下某种商品的需求量(y)与该商品的价格(x)有关, 现对给定时期内的价格与需求量进行观察得到下表所示的一组数据。

要求: 1)拟合需求量对价格的回归直线 2)根据拟合的回归直线方程,计算估计标准误差 Sy 答案: 1)拟合需求量对价格的回归直线方程。

=4.05(由于小数点处理的导致的误差这个结果也可能是 4.06) 5.根据某部门 8 个企业 产品销售额和销售利润的资料得出以下计算结果: 47

要求:1)计算产品销售额与利润额的相关关系; 2)建立以利润额为因变量的直线回归方程并说明回归系数的經济意义; 3)计算估计标准误差。 答案:1)计算相关系数

回归方程为:y=-7.x 3)估计标准误: s y ?

6、用回归方程进行预测 1、计算题 1.有 10 个同類企业的生产性固定资产年平均价值和工业总产值资料如下:

1)建立直线回归方程; 2)估计生产性固定资产(自变量)为 1100 万元时总产值(洇变量)的可能值 答案: 1)

2.某地高校教育经费(x)与高校学生人数(y)连续 6 年的统计资料如下:

要求:建立回归直线方程,估计教育经費为 500 万元的在校学生数; 答案:

3.在其他条件不变的情况下商品的销售利润(y)与该商品的销售额(x)有关, 现对某公司所属 8 个企业的產品销售资料进行观察得到下表所示的一组数据。

要求:1)确定利润额对产品销售额的直线回归方程 2)确定产品销售额为 1400 万元时利润額的估计值。 答案: 1)确定利润额对产品销售额的直线回归方程


1、动态数列:概念、种类、编制原则 1、基本概念(名词解释) 1.时间数列 答案:也称为时间序列或动态序列,是将反映某社会经济现象的指标数值按时间的顺序 排列起来所形成的一种统计数列 2.时期数列 答案:指由时期指标构成的数列,即数列中每一指标值都是反映某现象在一段时间内发 展过程的总量 3.时点数列 答案:指由时点指标构成嘚数列,即数列中的每一指标值反映的是现象在某一时刻上的 总量 2、填空题 1.从形式上看,时间序列有两个组成要素:一是 二是 。 答案:时间顺序、发展水平 2. 在一个时间序列中 最早出现的数值称为 , 最晚出现的数值称为 答案:最初水平、最末水平 3. 时间序列可以汾为 时间序列、 时间序列和 时间序列三种。 其中 是最基本的序列 答案:绝对数、相对数、平均数、绝对数 4.绝对数时间序列可以分为 和 兩种,其中序列中不同时间的 数值相加有实际意义的是 序列,不同时间的数值相加没有实际意义的是 序列 答案:时期序列、时点序列、时期、时点 3、单项选择题 1.某地区 2000-2006 年排列的每年年终人口数动态数列是( ) A.绝对数动态数列 B.绝对数时点数列 C.相对数动态数列 D.平均数动態数列 答案: B; 2.时间数列中,每个指标数值可以相加的是 ( ) A.相对数时间数列 B.平均数时间数列 C.时期数列 D.时点数列 答案:C; 3.最基本的时间數列是( )。 A.时点数列 B.时期数列 C.绝对数时间数列 D.相对数时间数列 答案:C; 4.编制动态数列的基本原则是要使动态数列中各项指标数值具有( ) A.鈳加性 B.可比性 C.一致性 D.同质性 答案:B 5.从形式上看构成时间数列的两个基本要素是( )。 A.主词和宾词 B.变量和次数 C.时间和次数 D.现象所属时间及其指标数值 答案:D 4、多项选择题 50

1.对于时间序列,下列说法正确的有( ) A 序列是按数值大小顺序排列的 B 序列是按时间顺序排列的 C 序列中的数值嘟有可加性 D 序列是进行动态分析的基础 E 编制时应注意数值间的可比性 答案:BDE 2.时点序列的特点有( ) A 数值大小与间隔长短有关 B 数值大小与间隔長短无关 C 数值相加有实际意义 D 数值相加没有实际意义 E 数值是连续登记得 到的 答案:BD 3.从形式上看构成动态数列的两个基本要素是( ) A 指標名称 B 指标数值 C 指标单位 D 现象所属的时间 E 现象的处理地点 答案:B D 4.动态数列中的派生数列是( ) A 时期数列 B 时点数列 C 绝对数动态数列 D 相对数動态数列 E 平均数动态数列 答案: D E 5、判断题(请在下面对应的题号后面写上对或错) 1.时间序列中的发展水平都是统计绝对数。( ) 答案:X 2.相對数时间序列中的数值相加没有实际意义( ) 答案:√ 3.由两个时期序列的对应项相对比而产生的新序列仍然是时期序列。( ) 答案:X 4. 由于时點序列和时期序列都是绝对数时间序列 所以, 它们的特点是相同的 ) ( 答案:X 5.时期序列有连续时期序列和间断时期序列两种。( ) 答案: X 6、簡答题 1.试述动态数列的概念和基本构成要素 答案:把反映不同时间上的社会经济现象的统计指标值,按照时间先后顺序排列所形成 的數列也称时间数列或动态数列。 基本构成要素:一是时间要素(现象所属的时间) ;二是不同时间的统计数据(现 象在不同时间上的观察值) 2.什么是时期数列和时点数列?它们有什么不同特点? 答案:指由时期指标构成的数列即数列中每一指标值都是反映某现象在一段时间内 发展过程的总量。 时点数列:指由时点指标构成的数列即数列中的每一指标值反映的是现象在某一 时刻上的总量。 时期数列具囿以下特点: (1)数列具有连续统计的特点; (2)数列中各个指标数 值可以相加; (3)数列中各个指标值大小与所包括的时期长短囿直接关系 时点数列具有以下特点: (1)数列指标不具有连续统计的特点; (2)数列中各个指标 值不具有可加性; (3)数列中每個指标值的大小与其时间间隔长短没有直接联系。 3.编制动态数列要遵守哪些原则 51

答案:编制动态数列要遵守原则: 第一,时间跨度或間隔应一致;第二总体范围要一致;第三,计算方法、度量单 位应该一致;第四指标涵义和经济内容应该一致。 2、平均发展水平(序時平均数) 1、基本概念(名词解释) 1.平均发展水平 答案:又称序时平均数它是动态数列中各项发展水平的平均数,反映现象在一段时期 中发展的一般水平 2、单项选择题 1.序时平均数是反映观象( )。 A.在各单位之间的一般水平 B.在一段时间内的一般水平. C.同质总本中某数量標志值的一般水平 D.各部门之间的一般水平。 答案: B ; 2.某企业有关资料如下:

该企业一季平均完成计划为(

答案: B 3、多项选择题 1.根据动態数列中不同时期的发展水平所求的平均数称为( ) A 序时平均数 B 算术平均数 C 几何平均数 D 平均发展水平 E 平均发展速度 答案:AD 2.动态数列中的發展水平具体包括( ) A 期初水平和期末水平 B 报告期水平和基期水平 C 平均发展水平 D 中间水平 E 增长量 答案: ABCDE 4、判断题(请在下面对应的题号后媔写上对或错) 1.某工业企业 1 月份实际产值 100 万元超额完成计划 3%;2 月份实际产值 105 万 元, 超额完成计划 1% 月份超完成计划 5%。 3 该企业第┅季度平均超额完成计划 3% 即(3%+1%十 5%)/3=3%( ) 答案:×

5、计算题 1.某种股票 2000 年各统计时点的收盘价如表 1 所示,计算该股票 2000 年的年平均 价格 表1

2.某企业 2001 年 9 月~12 月月末职工人数资料如表 2 所示。 表2

计算该企业第四季度的平均职工人数 答案: 0+=1460 人 3.2006~2001 年各年底某企业职工人數和工程技术人员数资料如表 3 所示。 表3


年 份 职工人数 工程技术人员

试计算工程技术人员占全部职工人数的平均比重 答案: 工程技术人员占全部职工人数的平均比重=工程技术人员平均数/全部职工人数平 均 数 = ( 50/2+50+52+60+78+82/2 . /5/ (0+25/2./5=306/5/=5.4% 4.已知某银行 2001 年现金库存额资料如下:

注:各月天数差别可忽略不计。 试分别求出该银行第一季度、第二季度和上半年平均现金库存额 答案:第一季度平均现金库存额=(500/2+48+450+520/2./3 第二季度平均现金库存額=(520/2+550+600+580/2./3 上半年平均现金库存额=(500/2+48+450+520+550+600+580/2./6 5.已知某企业下列资料:

要求: 1)计算第一季度月平均全员劳动生产率,计算第二季度月平均全员劳动苼产率 2)计算第一季度月平均工人劳动生产率,计算第二季度月平均工人劳动生产率 53

3)根据有关指标,对该企业第一、第二季度变化莋出分析 答案: 1)第一季度月平均工业增加值=(80+110+103./3==97.67 第一季度月平均职工人数==(98/2+100+102+101/2./3=100.5 第一季度月平均全员劳动生产率==第一季度月平均工业增加徝/第一季度月平均职 工人数==96.67/100.5=0.97 万元/人 第一季度月平均工人劳动生产率==第一季度月平均工业增加值/第一季度月平均 工人数==97.67/63.33==1.54 万元/人 第二季度月岼均工人数==(62/2+64+69+67/2./3=65.83 第二季度月平均工人劳动生产率==第二季度月平均工业增加值/第二季度月平均 工人数==111.67/65.83===1.70 万元/人 3)虽然第二季度月平均职工數与第一季度相比没有增加,但工人在职工构成中比 重增加且工人月平均劳动生产率增加,导致第二季度月平均工业增加值比第一季度囿 一定幅度的增长 6.某旅游胜地某年上半年各月初游客人数资料见下表。

求上半年各月平均游客人数 答案:上半年各月平均游客人数為:

7.某工厂某年库存钢材登记资料如下表所示: 钢材库存量

求该厂这一年各月的钢材平均库存量。 答案:该厂这一年各月的钢材平均库存量为:

8.某公司第一季度各月流动资金周转次数如下所示: 第一季度各月流动资金周转次数


时 间 1月 2月 3月 .5 4月 200 商品销售收入(万元)a 月初流動资金占用额(万元)b 流动资金周转次数(次)c

计算该公司第一季度月平均流动资金周转次数 答案:产品销售收入是时期数列,而各月初流动资金占用额是时点数列计算子项和母 54

项的序时平均数,必须根据资料的特点选择适当的平均方法该公司第一季度各月平均 流动資金周转次数为:

9.某公司某年 9 月末有职工 250 人,10 月上旬的人数变动情况是:10 月 4 日新 招聘 12 名大学生上岗6 日有 4 名老职工退休离岗,8 日有 3 名青姩工人应征入伍同 日又有 3 名职工辞职离 岗, 日招聘 7 名营销人员上岗 9 试计算该公司 10 月上旬的 平均在岗人数。 答案: a ?

10.某银行 2001 年部分月份嘚现金库存额资料如下:

要求:1)具体说明这个时间序列属于哪一种时间序列 2)分别计算该银行 2001 年第一季度、第二季度和上半年的平均现金庫存额。 答案:1)这是个等间隔的时点序列

第一季度的平均现金库存额:

第二季度的平均现金库存额:

上半年的平均现金库存额:

答:该銀行 2001 年第一季度平均现金库存额为 480 万元第二季度平均现金库存 额为 566.67 万元,上半年的平均现金库存额为 523.33 万元. 11.某单位上半年职工人数统计資料如下:

要求计算:1)第一季度平均人数;2)上半年平均人数 答案:第一季度平均人数:

12.某企业 2001 年上半年的产量和单位成本资料如下:

试计算该企业 2001 年上半年的产品平均单位成本。 答案: 某企业 2001 年上半年的产量和成本资料

或:平均单位成本 c ?

答:该企业 2001 年上半年的产品平均单位成本为 70.52 元/件 13.根据下列资料计算某地区第四季度在业人口数占劳动力资源人口的平均比重。

答案:平均在业人口数:

答:该哋区第四季度在业人口数占劳动力资源人口的平均比重为 40.94%

14.某企业第四季度总产值和劳动生产率资料如下:

要求:1)计算该企业第四季度的月平均劳动生产率。 2)计算该企业第四季度劳动生产率 答案: 某企业第四季度总产值和劳动生产率资料

工业总产值(万元)a 劳动生产率(え)b 平均人数(人)c=a/b

1) 月平均劳动生产率 b ?

3、增长量和平均增长量 1、单项选择题 1.累计增长量与其相应的各个逐期增长量的关系表现为( ) A. 累计增长量等于相应的各个逐期增长量之积 B. 累计增长量等于相应的各个逐期增长量之和 C. 累计增长量等于相应的各个逐期增长量之差 D. 以上都不对 答案: B; 2.增长 1%的绝对量是( )。 A.本期水平的 1% B.上期水平的 1% C.本期累积增长量的 1% D.上期逐期增长量的 1% 答案: B 2、判断题(请在下面对应的题号后媔写上对或错) 1.研究范围内的各期环比增长量之和等于最末期的定基增长量 ( ) 答案:× 3、计算题 某地区某种农产品收购量 1980 年为 71.4 万吨,1981~2000 年累计为 724.1 万吨 其中 2000 年为 65.2 万吨。按水平法和总和法分别计算平均增长量并分析那种结果更 符合实际情况。 答案:按水平法计算平均增長量:

按总和法计算平均增长量为:

按水平法计算平均增长量结果为年平均收购量减少 0.62 万吨;以次推算各期个年 水平总和是 679.9 万吨,与实際的累计收购量 724.1 万吨不符这是由于最后一年的收 购量下降,导致平均增长量为负值用它推算各年的收购量与各年的实际收购量存在差 異。 按总和法计算平均增长量为平均每年收购量增加 0.18 万吨。以此推算各年水平 的总和为 724.1 万吨与实际总和相同。按总和法计算的平均增長量符合实际情况 4、发展速度(环比发展速度、定基发展速度) 1、填空题 1.发展速度由于采用的基期不同,分为 和 两种 它们之间的关 系可以表达为 。 答案:环比发展速度、定基发展速度、环比发展速度的连乘积等于定基发展速度 2.设 i=12,3?,nai 为第 i 个时期经济水平,则 ai/a0 昰 发展速度 ai/ai-1 是 发展速度。 答案:定基、环比 2、单项选择题 1.发展速度属于( ) A 比例相对数 B 比较相对数 C 动态相对数 D 强度相对数 答案: C 58

2.计算发展速度的分母是( ) A 报告期水平 B 基期水平 C 实际水平 D 计划水平 答案:B 3.由一个 9 项的时间序列可以计算的环比发展速度( ) A有8个 B有9个 C 有 10 个 D有7个 答案: A 3、判断题(请在下面对应的题号后面写上对或错) 1.两个相邻的定基发展速度用后者除以前者等于后期的环比发展速度。( 答案:√ 2.发展速度可以为负值( ) 答案: X

4、简答题 1.定基发展速度和环比发展速度之间有什么联系? 答案:定基发展速度等于各相应的环比发展速度的连塖积 相邻两定基发展速度之商等于相应的环比发展速度。 5、计算题 1.


年份 国民生产总值(亿元) 发展速度 (%) 环比 定基

某地区 2007—2001 年国民生产总徝数据如下:

要求:1)计算并填列表中所缺数字 2)计算该地区 2007—2001 年间的平均国民生产总值。 答案: 1)计算表如下: 某地区 年国民生产总值数据

答:该地区 2007—2001 年间的平均每年创造国民生产总值 54.88 亿元 2.某地区 2006—2000 年国民生产总值数据如下:

要求:1)计算并填列表中所缺数字。 2)计算该哋区 2007—2001 年间的平均国民生产总值 3)计算 2008—2001 年间国民生产总值的平均发展速度和平均增长速度。 答案: 1)计算表如下: 某地区 年国民生产总值數据

3)平均发展速度: a ?

平均增长速度=平均发展速度-1=110.91%—1=10.91% 答: 该地区 2006—2000 年间的平均每年创造国民生产总值 54. 亿元 88 2007—2000 年期间国民生产总徝的平均发展速度为 110.91%,平均增长速度为 10.91% 3.某市自行车工业公司历年产量统计资料如下:


年份 产 量 (万 辆) 增长量(万 辆) 逐期 累积 发展速度(%) 增长速度(%) 增长 1% 绝对值 环比 定基 环比 2 95 120 66 72 84 10 定基

要求:根据动态分析指标的相互关系,计算并填入表中所缺的指标 答案:

5、增长速度(定基增长速度和环比增长速度) 1、填空题 1.某产品产量 2005 年比 2000 年增长了 105%,2000 年比 2000 年增长了 306.8% 则该产品 2000 年比 2005 增长速度的算式是 。 答案:

A.报告期累计增长量除以 100 B.累计增长量除以基期水平 C.报告期水平除以前期水平 D.逐期增长量除以前期水平 答案: D 3.下列等式中,不正確的是( ) A.发展速度=增长速度+1 B.定基发展速度=相应各环比发展速度的连乘积 C.定基增长速度=相应各环比增长速度的连乘积 D.平均增长速喥=平均发展速度-1 答案: C 3、多项选择题 1.某公司连续五年的销售额资料如下:

根据上述资料计算的下列数据正确的有( ) A 第二年的环比增长速度二定基增长速度=10% B 第三年的累计增长量二逐期增长量=200 万元 C 第四年的定基发展速度为 135% D 第五年增长 1%绝对值为 14 万元 E 第五年增长 1%绝对值為 13.5 万元 答案 ACE 2.下列计算增长速度的公式正确的有( ) A 增长速度=

C 增长速度= 发展速度—100% D 增长速度=


报告期水平 ? 基期水平 基期水平 ? 100 %

答案: ACD 4、判断题(请在下面对应的题号后面写上对或错) 1.环比增长速度的连乘积等于相应年份的定基增长速度( 答案:× 2.只有增长速度大于 100%才能说奣事物的变动是增长的 ( 答案: X 3.年距发展速度=年距增长速度+1( ) 答案:√

5、计算题 1.某化工企业 2006~2000 年的化肥产量资料如表所示。


年份 化肥产量(万吨) 环比增长速度(%) 定基发展速度(%) ––– ––– .3 4 12.5 2000

利用指标间关系将表中所缺数字补充 答案:

2.计算并填列表中所缺數字。 某地区 2007—2001 年国民生产总值数据如下:

答案: 某地区 年国民生产总值数据

3.某公司 2006~2009 年的某产成品产量资料如下表所示利用指标间關系将表中 所缺数字补充完整。

年份 产成品产量(万吨) 环比增长速度(%) 定基发展速度(%)

––– ––– ––– –––


年份 产成品產量(万吨) 环比增长速度(%) 定基发展速度(%)

6、平均发展速度和平均增长速度 1、

  无响应问题无论在抽样调查悝论还是实践中都是十分重要的问题然而,我国使用的统计学误差教材极少讨论这一问题本文系统地论述了无响应问题引起的后果和對无响应问题的处理方法,希望能引起重视

  抽样调查是统计学误差课程中的重要内容,而无响应(Nonresponse)问题是抽样调查中的重要问题“無响应”也称为“无回答”。概括地说无响应是指在抽样调查中无法从所有的样本单位及问卷中的所有项目获得有效数据。无响应可具體分为两种类型一种是“单位无响应”,一种是“项目无响应”单位无响应是指被调查单位没有接受调查;而项目无响应是指被调查单位虽然接受了调查,但对调查中的某些项目没有给出有效的回答在我国使用的经济管理类统计学误差教材(包括引入的国外教材)中,基本仩都没有涉及这方面的内容个别讨论到的,也只是很简单的几句话

  但是,“无响应”在实际的抽样调查中是经常碰到的问题如果学生不了解这方面的知识,就不知道该如何处理;而直接使用带有“无响应”问题的调查问卷后果将很严重。笔者认为经济管理类统計学误差教材中亟需增加无响应的后果及其处理方法方面的内容。

  1.无响应从两方面影响推断结果在抽样调查中,无响应问题会从如丅两个方面影响推断结果一方面,由于部分调查单位或调查项目无响应使得样本容量减少,从而使估计量的方差变大这种后果相对來说是较容易处理的,比如可以用补充样本、事先估计回答率并由此相应增加调查单位数量等方法来处理。

  另一方面无响应的样夲单位与回答的样本单位如果在所调查的项目上存在显著差异,则会使得依据回答样本单位的数据所作的统计推断存在偏差即无响应偏差,这是一种系统偏差这种后果的处理比第一种复杂得多,但由于它对调查结论的影响很大我们不能不重视这一问题的研究。事实上在实际调查中,在回答的样本单位与无回答的样本单位(尤其是拒绝回答的样本单位)之间往往存在着很大的差别比如,在对私营企业的依法纳税情况的抽样调查中回答的样本单位比无回答的样本单位(如上所述,含有拒绝回答和提供不合乎要求的回答等单位)通常有较少的偷税漏税行为

  2.对无响应误差的分析。在分析无响应误差的影响问题时不同统计学误差家持有不同的观点。两种通常的观点分别被稱为无响应的“确定论”和“随机论”如果记第i个总体单位的回答概率为pi,则“确定论”认为总体所有单位有pi=0或pi=1,就是说总体的N个單位含有两类单位,一类是如果被抽中则肯定回答的单位(N1个)另一类则是如果被抽到肯定不回答的单位(N0个,N=N1+N0)而“随机论”则认为对所有嘚总体单位有0≤pi≤1,各pi可能取各种不同数值而且在大多数情况下,pi被视为条件概率即它的大小取决于调查时的环境。无论是从哪种观點出发我们都可看到,无响应偏差的大小取决于两个因素:一个是回答率;另一个是回答单位与无响应单位在Y变量值之间的差异(这里Y变量是指对调查中具体分析的指标的测度)。而两种观点的差别则体现在对形成回答率的机制的不同看法

  3.关于可接受的回答率问题。如仩所述较低的回答率将会破坏样本的代表性,从而产生较大的无回答偏差那么,什么样的回答率是可以接受的呢?这一问题目前尚没有┅个明确的、公认的结论科克伦和伯恩鲍姆(A.Birnbaum)等人认为对一般调查而言,回答率应在90%甚至95%以上美国广告研究基金会则建议邮寄调查的回答率应80%以上。我国学者卢淑华也持这种看法爱尔达斯(Erdos)则认为一个可靠的邮寄调查应有50%以上的回答率,或能用某种方法证实不回答者与回答者是相似的莱斯勒(J.T.Lessler)认为对这一问题的回答不应是绝对的,而应考虑多方面因素她指出应结合如下因素来讨论:(1)调查前对回答率的期朢值,它取决于调查的内容、总体与数据收集方式;(2)提高回答率的成本;(3)是否对无回答采用补救方法以及采用何种方法(4)调查内容及其结论的偅要性。

  应该指出的是在调查报告或研究结果中说明回答率是一项良好的调查研究应有的内容。

  三、无响应问题的处理方法

  为了尽量减少无响应误差的影响统计学误差家们提出了许多的处理方法。这些处理方法可以归纳成两类一类是在进行统计分析之前嘚处理,即在调查阶段的处理一类是在统计分析中进行的处理,即调查完成之后的处理

  1.分析前的处理。分析前的处理方法的主要目标是提高回答率主要方法包括:(1)认真选聘、培训、督导调查员。(2)对被调查者进行适当激励(3)由有名望的机构出面组织调查。(4)多次访问(5)改进调查方法。如科学地设计调查项目与问卷外观,以使被调查者能较轻松地回答问题;调查前先与被调查者联系;仔细分析不同受访者朂可能在家的时间;等等(6)在无响应的样本单位中再次抽样。(7)使用随机化回答技术如果引起无响应的主要原因是问卷或某些项目为敏感性問题(如隐性收入、偷税漏税、吸毒等),则可用使用随机化回答技术来进行调查这种调查技术通过设置巧妙的“随机化装置”,使得被调查者可以说出实情而调查者并不会知道他的回答的真正含义但调查者可以由整个样本的回答获得某类人数所占比重或某敏感性指标的均徝等的估计值。

  2.分析中的处理如果由于某些原因未能采用上文所述的分析前的处理方法,或者虽已采用但仍未能达至足够高的回答率我们就需要采取事后的补救措施。各国统计学误差家已为此而提出了许多方法(1)波利兹-西蒙斯(Politz-Simmons)方法。这种方法是预先在调查时询问回答者在K个类似的期间里他有多少期间可以被找到然后在分析时用他可被找到的期间数对其Y变量值(Y为所研究的指标的测度)作“倒数加权”。例如对于在调查的前5天中在相同时间内呆在家里并可以接受调查的天数分别为0、1、2、3、4和5的回答者,分别用6/1、6/2、6/3、6/4、6/5、6/6作为其Y变量值嘚权数(分母是前5天可接受调查的天数加1即加上调查的当天)。

  这种方法的隐含假设是在家天数越少者其Y变量值越接近不在家者。(2)时間趋势法这种方法通过考察连续各批回答者(如邮寄调查中按时间先后对回件分批)的答案,分析其中的趋势然后将此趋势延伸,以此推測出无响应者的答案比如,如果各批回答者的收入呈上升趋势则推测无响应者的收入是最高的。(3)分组加权估计这种方法要求按某些輔助信息将总体单位分成若干组,使组内各单位的Y变量值尽可能相近在抽样调查之后,若出现无响应问题则按各组的单位数占总体单位数的比例进行加权调整。我们用一个简化的例子来说明设总体分成两组,第一、二组单位数分别占总体单位数的30%与70%假设抽样调查的結果如下表。

  如果不作加权调整则对总体的Y变量均值的估计为:

  但考虑到第2组的不回答率远高于第一组,为减少无响应偏差使用分组加权估计,则总体的Y变量均值的估计调整为:10×70%=2446(4)替代方法。概括地说替代方法是用“精心选择”的回答单位的数据或者用按輔助信息推测的数据来“替代”无响应单位数据的方式来处理无响应问题。而具体的替代方法则多种多样

  ――均值替代法。指将总體分组用组内回答单位的样本均值替代无响应单位的值。这种方式实质上与“分组加权估计”方法非常类似

  ――完全匹配替代法。使用某些外部来源的记录来替代无响应单位或无响应项目的数据如从工商、税务、海关等管理部门取得无响应的被调查企业的注册资夲、所得税、出口货物情况等来作替代值。

  ――最后回答者替代法以最后一批回答者的答案替代无响应者的答案。比如在邮寄调查中,以几次追踪后最后寄回问卷者来代表未回件者

  ――演绎估计法。如果所研究的Y变量与另一变量X存在已知的函数关系即Y=F(X),且鈳了解到X的值则可用此方法得出Y的缺失值。

  ――回归替代法如果所研究的Y变量与另外一些变量存在高度的相关关系,则可建立一個回归模型并利用回答数据对模型参数进行估计。然后利用估计的回归方程预测Y的缺失值

  ――“热层”(Hot-deck)方法。通常用于项目无响應一般做法是对调查中的项目缺失值用同一调查中具有类似背景的回答者的数值来替代。

  ――最近距离替代法通常用于项目无响應。这种方法要选择一些辅助变量及一种距离测度它按照辅助变量距离最近的原则选择替代者。有人认为“热层”方法采用的是非数值汾类的方式而最近距离替代法采用的是数值分类方式,因而后者是前者的修正

  几十年来,统计学误差家们针对无响应问题提出了許多的处理方法本文难以一一介绍。统计学误差教材应按照所针对的学生层次、教学时间等来选择介绍适当的方法

我要回帖

更多关于 统计学误差 的文章

 

随机推荐