单双边检验和单边检验如何查表描述

百度题库旨在为考生提供高效的智能备考服务全面覆盖中小学财会类、建筑工程、职业资格、医卫类、计算机类等领域。拥有优质丰富的学习资料和备考全阶段的高效垺务助您不断前行!

第二章 单样本模型 在有了一个样夲后很自然地想要知道它所代表 的总体“中心”在哪里.例如,在对人们的收入进行了抽 样之后就自然要涉及“人均收入”和“中间收入”等概 念.这就与统计中的对总体的均值(mean),中位数 (median)和众数(mode)等位置参数的推断有关 例如,在知道总体是正态分布时要检验其均值是否 为 ;一个传统的基于正态理论的典型方法是t检 验.它的检验统计量定义为 第一节 符号检验和中位数的置信区间 一、符号检验(SING TEST) 符号检驗(SING TEST)是利用正号和负号的数目对某种假设做出判定的非参数统计方法。 符号检验虽然是最简单的非参数检验但它体现了非参数统计的┅些基本思路. 普通符号检验基本方法: 如果研究的问题,可以看作只有两种可能:“成功”或“失败’,并且成功或失败被假定遵从二项汾布以+表示成功,-表示失败则随机抽取的样本就有两个参数:成功的概率P+,失败的概率P-。构造假设: 为了检验假设普通的符号检验定義的检验统计量为S+和S-。 S+表示为正符号的数目S-表示负符号的数目,且S++ S-=n, n是符号的总数目 为对假设作出判定,还需找到一个P值因为对于S+和S-來说,抽样分布是一个成功概率为0.5的二项分布若H0为真,由n, S+或S-可以得到P值若P指很小,则表明H0为真的可能性很小因而拒绝原假设。 应用 囚们一般认为广告对商品促销起作用但是否对某种商品的促销起作用并无把握。为了证实这一结论随机对15个销售某种商品的商店进行調查,得到的销售数据如下表: 位置符号检验 通常在正态总体分布的假设下关于总体均值的假设检验和区间估计是用与t检验有关的方法進行的。然而在本例中,总体分布是未知的为此首先看该数据的直方图从图中很难说这是什么分布。在右边的两个点分别是东京和香港 S+=得正符号的数目 S-=得负符号得数目 可以知道S+或S-均服从二项分布B(66,0.5)则S+和S-可以用来作检验的统计量。 备择假设:M<99一般来说,备择假設采用我们觉得有道理的方向因为只有一点为99,舍去这一点于是从66减少到65。而 =23,在零假设下(下面概率p=0.5)二项分布的概率: 。如果很小就鈳以拒绝零假设.上面这个概率就是该检验的p—值在这里的例子中n=65,k=23p=0.5。查表p值为0.0124 对于双边假设检验,为计算方便一般取相应於 和 中较小的一个做检验统计量;如用K表示,则K=min( )。在本例子中因为是双双边检验和单边检验,这P值应该二倍于单侧检验的为0.0248 注:在n仳较小时,可以用前面的二项分布的公式来计算精确p值但是当n较大时,就要用正态分布来近似如果又是二项随机变量,当n较大时比洳大于25,则可近似地认为在零假设下服从正态N(01)分布。但是由于正态分布是连续分布所以要进行连续修正。 检验的p值

详细的T检验说明可以参见:

Lloyd从2.8.1028.18版夲开始修改并增加了一些显著性检验的功能

以下内容的显示可能和最新版本的程序不一致。但是计算原理和用法是一致的

最新版本可鉯在这里下载:

N1,单样本:样本的平均值和母体平均值相等

N2,成对样本:两个母体各样本差值的母体平均值等于0(或某给定值)

N3,双樣本:两个母体的母体平均值相等

N4,回归分析:两个母体样本线性拟合斜率等于0(或某给定值)

S1,判断样本是否满足T检验的条件

S3,計算 T 值和自由度

S4,由 T 值和自由度计算 T 分布的概率 [1]

S5,比较此概率和给定的置信水平如果概率小于置信水平则拒绝虚无假设,否则接受虚无假设

关于虚无假设样本的选取:

C1,样本满足正态分布

C2,母体平均值已知

C3,样本的方差和母体方差相等 [2]

C1,两组样本差值满足正态分布

C2,两组样本的母体方差相等 [2]

C3,两组样本相互关联(比如同一样品不同时间的两次测试值)

C4,两组样本容量相等

C5,两組样本不能交叉 [3]

C1,组内样本满足正态分布

C2两组样本相互独立。

C1要求和成对样本一样。

使用 T 检验时要特别注意是用单边还是双边 P 徝。

Lloyd 给出的 T 检验的 P 值有两个:单边和双边的 P

其中单边的 P 值可能是左尾,也可能是右尾的 P 值具体判断看 T 值:

其中四个表述的含义是:

雙边:区域 34 的面积。及在 +/- T 值范围之外的几率计算式为 2 * 单边值

T 检验的单边和双边的区分和 F 检验有稍许不一样。应注意

在单样本和成对樣本中,理论上样本的方差和母体方差相等这一条是不要求的

因为单样本和成对样本的检验的虚无假设只有平均值,没有方差

但是实際情况一般既关注平均值又关注方差,比如某产品合格既要看平均值也要看范围

单样本和成对样本的检验只给出平均值的检验。通过平均值检验不一定通过方差检验

所以实际使用时一般和 F 检验一起做。F 检验看方差T 检验看平均值。两者都通过产品才合格。

双样本检测時不要求两组样本方差相等

成对样本要求两组样本不能交叉,是指不能出现某对样本其中一个值不能在“中间状态”(缺失或者未知)

下面有 4 个例子,分别对应:

1:某原材料规定材料长度规格为175+/-2

某市消费者协会抽查此材料是否合格,随机抽取5块原材料的测试结果如丅:

是否能用 T 检验判断该原材料测得的平均值和规格中的平均值有显著差异

如果可以用 T 检验,请判断结果

S1,判断样本是否满足T检验的條件

这个例子是 T 检验(单样本)。

一般认为运营良好(Cpk较高)的生产商的产品某性质的测试值都符合正态分布

母体的平均值已知(175)。

这一步我们先不判断方差是否相等

适用 T 检验(单样本)。

T检验(单样本)的虚无假设是样本的平均值和母体平均值相等。

S3计算 T 值囷自由度。

S4T 值和自由度计算 T 分布的概率。

Lloyd表格中任意位置输入数据

1 列输入各样本数据,第 2 列第 1 行输入母体平均值

选中后进入菜单:计算工具 - 统计 - 检验 - T 检验(单样本)。

S5比较此概率和给定的置信水平。如果概率小于置信水平则拒绝虚无假设否则接受虚无假设。

此例中T 值小于 0 表示样本平均值小于母体平均值。

Lloyd 会给出两个P值(单边和双边)计算式为:

其中 tcdf T 分布的累积密度函数,fabs 是取绝对值

P1 就是 T 分布的单边概率。P2T 分布的双边概率

此例中,因为规格要求是双边的及大于小于175均可。所以P值应该取双边概率

应接受虚无假設,认为原材料测得的平均值和规格中的平均值没有显著差异

T 检验(单样本)只是检验平均值,对于母体的标准差不关心

比如此例中,规格是 175+/-2测得的值里面 170169180 都超出了规格。

所以通过 T 检验(单样本)只是说平均值达标了标准差(产品的波动性)还要通过其他方法判断。见例1.1

1.1:由例 1 中的数据判断样品是否合格。

T 检验通过了平均值说明平均值是合格的。下面看 F 检验是否方差也合格

母体自由度為:无穷大(由于计算时无法使用无穷大,可以指定为一个很大的数比如 1000000

样本的方差为:21.7

此值远小于置信水平,拒绝 F 检验的虚无假设认为两者方差有显著差异。

Lloyd 表格直接计算 F 检验(单样本)也可以:

这些样本通过了 T 检验但是没有通过 F 检验。认为此公司生产不合格

1.2:如果例 1 中的长度规格为 >=175,由例 1 中的数据计算此公司产品合格率最高能达到多少

如果规格为 <=175,再计算合格率最高能达到多少

这个問题就是取单边的 P 值还是双边的 P 值的问题。也包含了是取左尾的 P 值还是右尾的 P 值的问题

>=175,只对最小值进行规定相当于 T 分布中大于某值嘚曲线积分面积。应该取右尾单边的 P 值例 1 中已经计算过此值:P(right) = 0.3603

即是说规格 >=175,合格率最高能达到 36% 左右

<=175,只对最大值进行规定相当于 T 分咘中小于某值的曲线积分面积。应该取左尾单边的 P

即是说规格 <=175,合格率最高能达到 64% 左右

1.3:如果规格还是175+/-2,由测得样本计算此公司產品合格率最高能达到多少

规格范围为:173 ~ 177。样本平均值为:174.2

即是说合格率最高只能达到 58% 左右。

2:某公司作了两次关于新建游泳馆的滿意度调查结果如下:

第一次:测试了 5 个人。5 分值的满意度分别是:44355

第一次:测试了同样的 55 分值的满意度分别是:35435

是否能用 T 检验判断两次调查结果有显著差异?

如果可以用 T 检验请判断结果。

S1判断样本是否满足T检验的条件。

这个例子是 T 检验(成对樣本)

一般认为测试结果都符合正态分布。

两次调查的样本是同样的 5 个人结果是有关联的,不是独立的

两次调查的结果没有交叉(沒有满意度“不评价”或者“不知道”的情况发生)。

适用 T 检验(成对样本)

注意:这里不能用 T 检验(双样本),因为样本不是独立的(同样的 5 个人)

T检验(成对样本)的虚无假设是,两个母体各样本差值的母体平均值等于 0(及调查结果没有显著差异)

S3,计算 T 值和自甴度

S4,由 T 值和自由度计算T分布的概率

Lloyd表格中任意位置输入数据。

1 列输入第一次各样本数据第 2 列第 1 行输入第二次各样本数据。

选Φ后进入菜单:计算工具 - 统计 - 检验 - T 检验(成对样本)

注意:这里的顺序不能打乱。比如第 1 行是 43表明第一个测试者第一次打分是 4 分,苐二次打分是 3

不能把第一次的分数和第二次的分数打乱再输入,要一一对应的输入

这里 P 值应该取双边概率,因为满意度分数向高分徝的偏差和向低分值的偏差都被允许

P 大于置信水平,调查结果没有显著差异

2.1:同例 2,如果第二次调查找的人不是同样的 5 人是否能鼡 T 检验(成对样品)判断两次调查结果有显著差异?

不能如果两次找的人不一样,应该用 T 检验(双样本)

跟例 2 不一样,在双样本检验Φ因为两组样本是独立的,输入顺序是可以打乱的

2.2:同例 2,如果第二次时某一位测试者无法对满意度做出判断而在满意度调查时寫了一个“不知道”。

这样能否进行 T 检验(成对样品)

不能。这样两个样本就出现了“交叉”

类似的,比如医院抽取了 100 个高血压病人測血压他们然后服用某降压药物,隔了一个月之后再对这 100 个病人测血压

如果其中有病人缺席第二次的实验,或者第二次实验室血压数據有问题也不能进行 T 检验(成对样品)。

在比如某公司设计问卷调查时,某个选项设置了“是”“否”两个选项。

如果同一批参与調查者总的某一位第一次问卷回答的“是”第二次却没有做回答或回答“不知道”。此时也不能进行 T 检验(成对样品)

2.35 名实验者,服用某增高药物后一年前后身高数据如下:

判断药物是否显著影响增高

此例主要是说 P 值取单边还是双边,置信水平也应该取多少

由於关注的是“增高”药物,所有的样本都分布在“增高”那一侧不可能有“降高”出现。

所以所有样本要么增高,要么身高不变这個假定是合理的。

置信水平也应该取 0.025

P 大于置信水平,认为两个母体各样本差值的母体平均值没有显著差别(即药物增高作用不显著)

0.02672 距离 0.025 很近。表示“增高作用不显著”的几率只有 2.672%但是样本量太少,证据不足以拒绝虚无假设此时应该考虑增加样本量再做判断)。

2.4:由 2.3该药物标称一年后会增高大约 10 厘米。

判断药物实际效果是否显著区别于 10 厘米的增高量

在表格第三例第一行输入 -10

注意默认计算嘚是第一列减去第二列的差值因为题目中是“增高”,第二列数据更大差值应为 -10

选中此三列后进入菜单:计算工具 - 统计 - 检验 - T 检验(荿对样本)得到:

此例是看单边还是看双边呢?

由描述:“增高大约 10 厘米”表示可能增高 8 厘米,也可能增高 12 厘米及左右两侧都可接受(认为母体样本左右两侧都有分布)。

不能拒绝虚无假设不认为实际效果显著区别于 10 厘米。

(同样0.08451 距离 0.05 很近。表示“增高大约 10 厘米”的几率只有 8.451%但是样本量太少,证据不足以拒绝虚无假设此时应该考虑增加样本量再做判断)。

3:抽取1020岁实验者(64 女)做性別和身高调查结果如下:

是否能用 T 检验判断性别和 20 岁男性身高和 20 岁女性身高是显著差异?

如果可以用 T 检验请判断结果。

S1判断样本是否滿足 T 检验的条件。

这个例子是 T 检验(双样本)

一般认为同年龄人类的身高测试值都符合正态分布。

男女之间身高测试相互独立

适用 T 检驗(双样本)。

T检验(双样本)的虚无假设是两个样本的母体平均值相等(男女身高没有显著差异)。

S3计算 T 值和自由度。

S4T 值和自甴度计算 T 分布的概率。

Lloyd表格中任意位置输入数据

1 列输入样本 1 数据,第 2 列输入样本 2 数据

选中后进入菜单:计算工具 - 统计 - 检验 - T 检验(雙样本)。

S5比较此概率和给定的置信水平。如果概率小于置信水平则拒绝虚无假设否则接受虚无假设。

这里会出来好几个 P 值具体用哪一个看具体分析:

1 步,看两个样本的母体方差是否相等第 2 步,看单边还是双边

先进行第 1 步,由 F 检验看方差(方法同例 1.1或者参见 F 檢验的相关帮助文件)。

F 检验的 P 值大于置信水平认为两组样本母体方差相等。

再进行第 2 步看单边还是双边。

因为问题是男女身高是显著差异男身高大于或小于女身高都要考虑。应该取双边概率

小于置信水平,应该拒绝虚无假设认为男女身高有显著差异。

如果问题昰:男性身高是否显著高于女性

首先判断 T>0(或者直接看平均值),说明前者平均值更大及男性平均更高。

然后取单边概率 P = 0.0001455小于置信沝平。

应该拒绝虚无假设认为男身高明显大于女性身高。

如果问题是:女性身高是否显著高于男性

首先判断 T>0(或者直接看平均值),說明前者平均值更大及男性平均更高。

4:测试某木材甲醛释放量随时间的变化关系

第一列为天数第二列为百分比。

判断甲醛释放量昰否和天数有关

虚无假设是,期望斜率值 0认为甲醛释放量是否和天数无关。

Lloyd 任意两列输入数据选中此两列后进入菜单:计算工具 - 統计 - 检验 - T 检验(线性回归斜率)。

T 检验(回归分析)的结果是:

这里取双边概率(斜率值在 0 附近大于小于均可)。

P = 0.0007228小于置信水平,應该拒绝虚无假设认为甲醛释放量和天数有关。

4.1:如果从第 10 天开始甲醛释放量随天数的变化情况如下:

判断此时甲醛释放量是否和忝数有关。

双边 P = 0.6315大于置信水平,应该接受虚无假设认为此时甲醛释放量和天数无关。

Lloyd 进行线性回归斜率的 T 检验时默认的期望斜率值昰 0

如果要指定某斜率值在数据的第三列第一行输入斜率值,再选中此三列进行 T 检验(线性回归斜率)即可

加载中,请稍候......

我要回帖

更多关于 单边检验拒绝域 的文章

 

随机推荐