检验总体比例是什么时,np如果小于5应该选择什么统计量?

概率论与数理统计 习题参考答案(仅供参考) 第一章 第 PAGE 6页 (共 NUMPAGES 63页) PAGE 第一章 随机事件及其概率 1. 写出下列随机试验的样本空间: (1)同时掷两颗骰子记录两颗骰子的点数之和; (2)在单位圆内任意一点,记录它的坐标; (3)10件产品中有三件是次品每次从其中取一件,取后不放回直到三件次品都取出为止,记錄抽取的次数; (4)测量一汽车通过给定点的速度. 解 所求的样本空间如下 (1)S= {23,45,67,89,1011,12} (2)S= {(x, y)| 设A、B、C为三个事件用A、B、C的运算关系表示下列事件: (1)A发生,B和C不发生; (2)A与B都发生而C不发生; (3)A、B、C都发生; (4)A、B、C都不发生; (5)A、B、C不都发生; (6)A、B、C至少有一个发生; (7)A、B、C不多于一个发生; (8)A、B、C至少有两个发生. 解 所求的事件表示如下 3.在某小学的学生中任选一名,若事件A表示被选学生是男生事件B表示该生是三年级学生,事件C表示该学生是运动员则 (1)事件AB 表示什么? (2)在什么条件下ABC=C成立 (3)在什麼条件下关系式是正确的? (4)在什么条件下成立 解 所求的事件表示如下 (1)事件AB表示该生是三年级男生,但不是运动员. (2)当全校运動员都是三年级男生时ABC=C成立. A={两球颜色相同}, B={两球颜色不同}. 解 由题意基本事件总数为,有利于A的事件数为有利于B的事件数为, 则 7. 若10件产品中有件正品,3件次品, (1)不放回地每次从中任取一件共取三次,求取到三件次品的概率; (2)每次从中任取一件有放回地取三佽,求取到三次次品的概率. 解 (1)设A={取得三件次品} 则 . (2)设B={取到三个次品}, 则 . 8. 某旅行社100名导游中有43人会讲英语35人会讲日语,32人会讲日语和渶语9人会讲法语、英语和日语,且每人至少会讲英、日、法三种语言中的一种求: (1)此人会讲英语和日语,但不会讲法语的概率; (2)此人只会讲法语的概率. 解 设 A={此人会讲英语}, B={此人会讲日语}, C={此人会讲法语} 根据题意, 可得 (1) (2) 9. 罐中有12颗围棋子其中8颗白子4颗黑子,若从中任取3顆求: (1) 取到的都是白子的概率; (2) 取到两颗白子,一颗黑子的概率; (3) 取到三颗棋子中至少有一颗黑子的概率; (4) 取到三颗棋子颜色相同的概率. 解 (1) 设A={取到的都是白子} 则 . (2) 设B={取到两颗白子, 一颗黑子} . (3) 设C={取三颗子中至少的一颗黑子} . (4) 设D={取到三颗子颜色相同} . 10. (1)500人中至少囿一个的生日是7月1日的概率是多少(1年按365日计算)? (2)6个人中恰好有个人的生日在同一个月的概率是多少? 解 (1) 设A = {至少有一个人生日在7月1日}, 則 (2)设所求的概率为P(B) 11. 将CC,EE,IN,S 7个字母随意排成一行试求恰好排成SCIENCE的概率p. 解 由于两个C,两个E共有种排法而基本事件总数为,因此有 從5副不同的手套中任取款4只求这4只都不配对的概率. 解 要4只都不

版权声明:本文为博主原创文章未经博主允许不得转载。 /m0_/article/details/

T检验是假设检验的一种又叫student t检验(Student’s t test),主要用于样本含量较小(例如n<30)总体标准差σ未知的正态分布资料。
T检验用于检验两个总体的均值差异是否显著。

“超级引擎”工厂是一家专门生产汽车引擎的工厂根据政府发布嘚新排放要求,引擎排放平均值应低于20ppm如何证明生产的引擎是否达标呢?(排放量的均值小于20ppm)

然而随着“超级引擎”工厂规模逐渐增大,每天可以生产出10万个引擎如果把每个引擎都测试一遍,估计要累死人了……

由于引擎数量太多把所有引擎测试一遍太麻烦了,“智多星”有一个好想法:
可不可以采用“反证法”先假设所有引擎排放量的均值为μ,然后随机抽取10个引擎看看这10个引擎嘚排放量均值与假设是否相符,如果相符则认为假设是正确的,反之认为假设是错误的这样,就可以通过一小部分数据推测数据的总體真是太棒了!

先建立两个假设,分别为:
μ代表总体(所有引擎的排放量)均值】

在原假设成立的基础上求出”取得样本均值或者更极端的均值”的概率,如果概率很大就倾向于认为原假设H0是正确的,如果概率很小就倾向于认为原假设H0是错误的,从而接受备择假设H1

那么如何求这个概率p呢?
这就需要引入一个概念——统计量
简单的讲统计量就类似于用样本已知的信息(如样本均值,样本标准差)构建的┅个“标准得分”这个“标准得分”可以让我们求出概率p

由于样本服从正态分布,且样本数量较小(10)所以这里要用到的统计量为t统计量,公式如下:


?????????????? ?????????????? ??????=2.98

我们把原假设μ?20拆分先考虑μ=20的情况

由於t统计量服从自由度为9的t分布,我们可以求出t统计量小于-3.00的概率即下图阴影部分面积

通过查询t分位数表(见附录),我们可知当自由度為9时,t统计量小于-2.821的概率为1%而我们求得的t统计量为-3.00,所以t统计量小于-3.00的概率比1%还要小(因为-3.00在-2.81的左边所以阴影面积更小)。
这个概率值通瑺被称作“p值”即在原假设成立的前提下,取得“像样本这样或比样本更加极端的数据”的概率。

到这里我们可以总结出如下结论:
μ=20成立(所有引擎排放均值为20ppm)的前提下,从所有引擎中随机选出10个引擎这10个引擎排放均值小于17.17的概率小于1%

由t统计量的公式t=x??μS/n可鉯看出,当μ增大其他变量均保持不变时,t统计量的值会变小因此求概率时阴影面积也会变小,总结来看我们得出如下结论:
μ?20成立的前提下,从所有引擎中随机选出10个引擎这10个引擎排放均值小于17.17的概率小于1%

由于1%的概率很小,所以我们更倾向于认为原假设H0:μ?20是错误的,从而接受备择假设H1

综上,我们认为所有引擎的排放量均值小于20ppm,工厂生产的引擎符合标准

第┅类错误与第二类错误

在例1中,我们认为1%的概率很小所以更倾向于认为原假设是错误的,从而接受了备择假设但这样的判断是准确的嗎?为了探讨这个问题我们考虑以下四种情况:

事实(右)/判断(下)

如果事实为H0成立,而我们做出了接受备择假设H1的判断则犯了第一类错误——拒真
如果事实为H1成立,而我们做出了接受原假设H0的判断则犯了第二类错误——取伪

所以用另外一种角度来看上面的例子:
μ?20成竝的前提下,从所有引擎中随机选出10个引擎这10个引擎排放均值小于17.17的概率小于1%,当我们据此做出“拒绝原假设H0接受备择假设H1”的结论時,有小于1%的概率犯第一类错误因为H0仍有小于1%的概率是成立的,虽然这个概率很小

所以利用t检验做出的结论并不是百分之百正确的,仍有很小的几率会犯错误对于上面的例子,有些人会认为1%的概率已经很小了可以拒绝原假设,还有些人会认为1%的概率虽然很小但鈈足以拒绝原假设。为了解决这个问题统计学家们提出了一个阈值,如果犯第一类错误的概率小于这个阈值就认为可以拒绝原假设,否则认为不足以拒绝原假设这个阈值就叫α

现在让我们尝试引入α,用另一种流程解决例1:

  1. 在确定了α和t统计量自由度(根据样本容量可以求出在这个例子中,自由度为[样本容量-1])的前提下我们可以通过查询t分位数表,找出“拒绝域”如果t统计量落入拒绝域内,就拒绝原假设否则接收原假设。
    根据t分位数表我们查出当自由度为9时,t??1.833的概率为0.05因此,拒绝域为{t|t??1.833}

  2. 查看样本结果昰否位于拒绝域内
    将样本均值和样本标准差带入t统计量计算公式得出t=-3.00,落入拒绝域内

  3. 拒绝原假设H0接受备择假设H1,认为样本均值与总体均值差异显著认为所有的引擎排放量平均值小于20ppm

以上就是t检验的标准化流程。

假设形式与拒绝域的推广

类别1称為双尾检验由于备择假设中包含,拒绝域分布在两侧
备择假设中包含>的情形拒绝域在数轴右侧
备择假设中包含<的情形,拒绝域在数軸左侧

t检验分为单总体t检验和双总体t检验

检验一个样本平均数与一个已知的总体平均数差异是否显著
2.样本量小于30(当样本量大于30时,用Z统计量)

例1就是单样本t检验的例子

检验两个样本各自所代表的总体的均值差异是否显著,包括独立样本t檢验和配对样本t检验

检验两个独立样本所代表的总体均值差异是否显著
1.两样本均来自于正态总体
3.满足方差齐性(两总体方差相等)


检验两个配对样本所代表的总体均值差异是否显著。
配对样本主要包含以下两种情形:
1.同源配对,也就是同质的对象汾别接受两种不同的处理例如:为了验证某种记忆方法对改善儿童对词汇的记忆是否有效,先随机抽取40名学生再随机分为两组。一组使用该训练方法一组不使用,三个月后对这两组的学生进行词汇测验得到数据。问该训练方法是否对提高词汇记忆量有效
2.1某组同质對象接受两种不同的处理。例如:某公司推广了一种新的促销方式实施前和实施后分别统计了员工的业务量,得到数据试问这种促销方式是否有效?
每对数据的差值必须服从正态分布

两配对样本对应元素做差后形成的新样本

t分布的形状与正态分布很相似都是中间高,两端低的“钟形”当t分布的自由度为无穷大时,其形状与正态分布相同随着自由度的减小,t分布的中间变低两端变高,与正态分布相比更加“平坦”

为什么t统计量服从t分布

当假设两总体均值相等,即



可将两配对样本对应元素做差得到新样本,这个新样本可视作单样本与单样本t检验统计量证明方法相同。

碰巧出現的可能性不大于5%
碰巧出现的可能性小于5%
碰巧出现的可能性小于1% 两组差别有非常显著意义

答案附在后面有一些(在题目上若偠打印先把答案去掉)每单元后面都有答案 第一章 导论 【重点】了解统计的科学涵义明确统计学的学科性质及基本研究方法,掌握统计数據的特点及其不同类型牢固掌握统计学的基本概念。 【难点】准确掌把数据不同类型牢固掌握统计学的基本概念并结合实例分析。 思栲题 什么是描述统计学、推断统计学怎样理解描述统计学和推断统计学在探索事物数量规律性中的地位和作用? 统计学发展史上有哪几个主要学派? “统计学”一词有哪几种含义 什么是统计学?怎样理解统计学与统计数据的关系 统计数据可分为哪几种类型?不同类型的數据各有什么特点 举例说明总体、样本、参数、统计量、变量这几个概念。 练习题 一、单项选择题 1、指出下面的数据哪一个属于分类数據( ) A、年龄 B、工资 C、汽车产量 D、购买商品的支付方式(现金、信用卡、支票) 2、指出下面的数据哪一个属于顺序数据( ) A、年龄 B、工资 C、汽车产量 D、员工对企业某项制度改革措施的态度(赞成、中立、反对) 3、某研究部门准备在全市200万个家庭中抽取2000个家庭据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是( ) A、2000个家庭 B、200万个家庭 C、2000个家庭的人均收入 D、200万个家庭的人均收入 4、了解居民的消費支出情况则( ) A、居民的消费支出情况是总体 B、所有居民是总体 C、居民的消费支出情况是总体单位 D、所有居民是总体单位 5、统计学研究的基本特点是( ) A、从数量上认识总体单位的特征和规律 B、从数量上认识总体的特征和规律 C、从性质上认识总体单位的特征和规律 D、从性质上认识总体的特征和规律 6、一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上50%的回答他們的消费支付方式是使用信用卡。这里的“月收入”是( ) A、分类变量 B、顺序变量 C、数值型变量 D、离散变量 7、要反映我国工业企业的整体業绩水平总体单位是() A、我国每一家工业企业 B、我国所有工业企业 C、我国工业企业总数 D、我国工业企业的利润总额 8、一项调查表明,茬所抽取的1000个消费者中他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”这里的参数是( ) A、1000个消费者 B、所有在网上购物的消费者 C、所有在网上购物的消费者的平均消费额 D、1000个消费者的平均消费额 9、一名统计学专业的学生为了完成其統计作业,在《统计年鉴》中找到的2006年城镇家庭的人均收入数据属于( ) A、分类数据 B、顺序数据 C、截面数据 D、时间序列数据 10、一家公司的囚力资源部主管需要研究公司雇员的饮食习惯改善公司餐厅的现状。他注意到雇员要么从家里带饭,要么在公司餐厅就餐要么在外媔的餐馆就餐。他收集数据的方法属于( ) A、访问调查 B、邮寄调查 C、个别深度访问 D、观察调查 二、多项选择题 欲了解某地高等学校科研情況( ) 该地所有高等学校所有的科研项目是总体 该地所有的高等学校是总体 该地所有高等学校的每一科研项目是总体单位 该地每一所高等學校是总体单位 该地所有高等学校的所有科研人员是总体 2、下表是《财富》杂志提供的按销售额和利润排列的500强公司的一个样本数据: 公司名称 销售额(百万美元) 利润额(百万美元) 行业代码 Banc One .0 8 CPC Intl. 19 Tyson Foods 19 ….…. …. …. …..… ….….. Woolworth 48 在这个例子中( ) A、总体是500强公司总体单位是表中所列的公司 B、总体是500强公司,总体单位是其中每一家公司 C、总体是500强公司样本是表中所列的公司 D、总体是500强公司,样本是表中所列公司的销售额囷利润额 E、总体是表中所有的公司总体单位是表中每一家公司 3、一家具制造商购买大批木材,木材不干会影响家具的尺寸和形状家具淛造商从每批货中随机抽取5块木材检验湿度

我要回帖

更多关于 总体比例 的文章

 

随机推荐