统计假设检验的概念和统计推断是同一种概念吗? 统计假设检验的概念有那两种各有什么含义?

05-1502-1602-1602-1602-1602-1602-1602-1602-1602-16最新范文01-0101-0101-0101-0101-0101-0101-0101-0101-0101-0101-0101-0101-0101-0101-01「统计学」「统计推断」「统计学习」有什么区别? - 知乎有问题,上知乎。知乎作为中文互联网最大的知识分享平台,以「知识连接一切」为愿景,致力于构建一个人人都可以便捷接入的知识分享网络,让人们便捷地与世界分享知识、经验和见解,发现更大的世界。63被浏览<strong class="NumberBoard-itemValue" title="分享邀请回答571 条评论分享收藏感谢收起53 条评论分享收藏感谢收起写回答当前位置:
&请教一个关于统计推断的问题
请教一个关于统计推断的问题
作者 sapphirechina
本人有一篇文章审回来了,有一个意见是关于统计推断的,我不能理解审稿人的意思,哪位高手能帮忙指点为谢!
问题如下,表格数据见图:
Table 2 presents the means of D_ij values. What could be a reference distribution of D_ij? It would be better to use statistical inferences when they are to be said different or similar. At least, empirical sets of D_ij values are in this manuscript.
表格中的数据即为D_ij值。他的问题中所指的该值的参考分布,该如何理解呢?
当说这些数值不同或相似时,最好使用统计推断。请问这里所说的统计推断,具体指哪些方法呢?
至少,该数值的经验数据集在文章中有。是否就是指对表格中的数据进行统计推断分析呢?
data table.jpg
英语和数学都不太好,但又想抛砖引玉一下,所以在此说一两句,仅供楼主参考
编辑认为D_ij的值不是确定值,即D_ij可看成一个随机变量,既然是随机变量,那问题就来了,既然是变量,顾名思义,其观测值就不可能唯一,这就会产生问题,即当下标ij不同时,虽然你得到的观测值是不一样,但D_ij的值是否真的不一样呢?又如何来描述它们的不一样呢?
比如用两种药品来比照治疗同一种疾病,怎么描述它们的治疗效果不一样呢?--这肯定不能简单地看数据直接得出。就像你和你一个跑得差不多快的同学,一起跑步,不能由一两次的跑步成绩不一样,就直接说谁跑得快一样。
对二个随机变量来说,要说明二者确有显著差异,通常是问它们的分布是否一样,或简单一点,问题它们的均值或方差等数字特征是否一样。这时候就需要应用统计推断来推导了。如果只是想判断它们的均值是否不一样,为了简单,通常需要假设随机变量的分布是什么,当然为了计算简单,通常假设是正态分布。到此,具体的统计推断方法,相信楼主应该在大学学过了,回去翻翻若干年前的书就可以了,
引用回帖:: Originally posted by math2000 at
英语和数学都不太好,但又想抛砖引玉一下,所以在此说一两句,仅供楼主参考
编辑认为D_ij的值不是确定值,即D_ij可看成一个随机变量,既然是随机变量,那问题就来了,既然是变量,顾名思义,其观测值就不可能唯一, ... 非常感谢您的指点!
审稿人问什么可以是D_ji值的参考分布,是否均值、SD添加到表格中即可?然后给出每个均值的置信区间?
如果要给置信区间的话,确实是要假设D值是正态分布吧?
我每个组就只有4个样本,以此来判断其分布为正态,是否可行呢?
还望再帮忙看看指点为谢!
引用回帖:: Originally posted by sapphirechina at
非常感谢您的指点!
审稿人问什么可以是D_ji值的参考分布,是否均值、SD添加到表格中即可?然后给出每个均值的置信区间?
如果要给置信区间的话,确实是要假设D值是正态分布吧?
我每个组就只有4个样本,以此 ... 如果知道D的值服从正态分布,可以直接用假设检验。
但问题是如果不知道D的值是否服从正态分布,这时候就需要先检验其分布是否为正态分布,但楼主的样本太少,恐怕不好检验。
如果不假设其服从正态分布,用非参数的方法,也有样本太少的问题。
一是能否增加样本?二是看能否用自助抽样的方法?
引用回帖:: Originally posted by math2000 at
如果知道D的值服从正态分布,可以直接用假设检验。
但问题是如果不知道D的值是否服从正态分布,这时候就需要先检验其分布是否为正态分布,但楼主的样本太少,恐怕不好检验。
如果不假设其服从正态分布,用非参数 ... 我已经用SPSS检查过了,虽然样本少,但是结果是有,是正态分布。
针对每个均值的置信区间我也算出来了,是不是这样就可以了呢?审稿人的要求算是达到了么?
那么我的问题是,把每个均值的置信区间算出来,能说明什么问题呢?
引用回帖:: Originally posted by sapphirechina at
我已经用SPSS检查过了,虽然样本少,但是结果是有,是正态分布。
针对每个均值的置信区间我也算出来了,是不是这样就可以了呢?审稿人的要求算是达到了么?
那么我的问题是,把每个均值的置信区间算出来,能说明 ... 最好是假设检验,给出p值
引用回帖:: Originally posted by math2000 at
最好是假设检验,给出p值
个人建议... 请问假设检验怎么写呢,能否给个范例参考一下?
另外,假设检验和置信区间的区别是什么呢?
估计是要你做非参数假设检验
24小时热帖
下载小木虫APP
与700万科研达人随时交流假设检验_百度百科
清除历史记录关闭
声明:百科词条人人可编辑,词条创建和修改均免费,绝不存在官方及代理商付费代编,请勿上当受骗。
假设检验(Hypothesis Testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的进行检验,作出拒绝或接受假设H0的判断。常用的假设检验方法有、法、χ2检验法()、,等。
假设检验简介
假设检验又称统计假设检验(注:显著性检验只是假设检验中最常用的一种方法),是一种基本的形式,也是的一个重要的分支,用来判断与样本,样本与的差异是由引起还是本质差别造成的统计推断方法。
其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
假设检验基本思想
假设检验的基本思想是小概率思想。小概率思想是指小概率事件(P&0.01或P&0.05)在一次试验中基本上不会发生。思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为不假设成立。
假设是否正确,要用从总体中抽出的样本进行检验,与此有关的理论和方法,构成假设检验的内容。设A是关于总体分布的一项命题,所有使命题A成立的总体分布构成一个集合h0,称为原假设(常简称假设)。使命题A不成立的所有构成另一个集合h1,称为备择假设。如果h0可以通过有限个实参数来描述,则称为参数假设,否则称为非参数假设(见)。如果h0(或h1)只包含一个分布,则称原假设(或备择假设)为,否则为。对一个假设h0进行检验,就是要制定一个规则,使得有了样本以后,根据这规则可以决定是接受它(承认命题A正确),还是拒绝它(否认命题A正确)。这样,所有可能的样本所组成的空间(称)被划分为两部分HA和HR(HA的补集),当样本x∈HA时,接受假设h0;当x∈HR时,拒绝h0。集合HR常称为检验的,HA称为接受域。因此选定一个检验法,也就是选定一个拒绝域,故常把检验法本身与拒绝域HR等同起来。
假设检验基本方法
有时,根据一定的理论或经验,认为某一假设h0成立,例如,通常有理由认为特定的一群人的身高服从正态分布。当收集了一定数据后,可以评价实际数据与理论假设h0之间的偏离,如果偏离达到了“显著”的程度就拒绝h0,这样的检验方法称为显著性检验。偏离达到显著的程度通常是指定一个很小的正数α(如0.05,0.01),使当h0正确时,它被拒绝的概率不超过α,称α为。这种假设检验问题的特点是不考虑备择假设,考虑实验数据与理论之间的程度如何,故此时又称为。拟合优度检验是一类重要的显著性检验。
K.皮尔森在1900年提出的Ⅹ检验是一个重要的拟合优度检验。设原假设h0是:“总体分布等于某个已知的F(x)”。把(-∞,∞)分为若干个两两无公共点的I1,I2,…,Ik,对任一个区间,以vj记大小为n的样本X1,X2,…,Xn中落在Ij内的个数,称为区间Ij的观测,另外,求出Ij的理论频数(对j=1,2,…,k都这样做),再算出由下式定义的Ⅹ统计量,皮尔森证明了:若对j=1,2,…,k,则当n→∞时,Ⅹ的极限分布是为k-1的Ⅹ分布。于是在样本大小n相当大时,从Ⅹ分布表可查得Ⅹ分布的上α(见)Ⅹ(k-1)。由此即得检验水平为α的拒绝域:{Ⅹ≥Ⅹα(k-1)}。如果原假设h 0为:总体服从分布族{Fθ,θ∈嘷},式中θ为未知参数,嘷为θ的所有可能取值的集合(称),也可得到类似的拒绝域,只要在计算理论vj时,将所包含的未知参数θ用适当的代替,即可计算 Ⅹ统计量。但此时极限分布的自由度为 k-Л-1,式中Л为θ中的独立参数的个数。检验(见)也是一个重要的拟合优度检验方法。
奈曼-皮尔森理论  J.奈曼与 E.S.皮尔森合作,从1928年开始,对假设检验提出了一项系统的理论。他们认为,在检验一个假设h0时可能犯两类错误:
真实情况为h0成立(即θ∈嘷0),但判断h0不成立,犯了“以真为假”的错误。是h0实际不成立(即θ∈嘷1),但判断它成立,犯了“以假为真”的错误(见表)。这里嘷0,嘷1分别是使假设h0成立或不成立的θ的集合,显然嘷=嘷0+嘷1。当θ∈嘷0,样本X(即X1,X2,…,Xn组成的向量)∈HR,其概率Pθ(X∈HR)就是犯第一类错误的概率α;
当θ∈嘷1,样本X∈HA,其概率就是犯第二类错误的概率β。通常人们不希望轻易拒绝h0,例如工厂的产品一般是合格的,出厂进行时不希望轻易地被认为不合格,
于是在限定犯第一类错误的概率不超过某个指定值α(称为检验水平)的条件下,寻求犯第二类错误的概率尽可能小的检验方法。为了描述检验的好坏,称θ的函数Pθ(X∈HR)为检验的功效函数。例如上述的例子中,所采用的检验可以是:当样品中的废品个数超过一定限度时,认为该批产品不合格,否则就认为合格。这个检验的功效函数有图示的形状,图中的 p0、p1、α、β根据需要选定。这种图形清楚地描述了犯两类错误的概率。
优良性准则  基于奈曼-皮尔森理论及,可以提出一些准则,来比较为检验同一假设而提出的各种检验。较重要的准则有:
一致最大功效(UMP)准则  欲检验h0:θ∈嘷0,h1:θ∈嘷1;当给定检验水平α后,在所有满足的可供选择的检验HR中,是否有一个最好的,亦即:是否存在拒绝域H,使得对于所有θ∈嘷1及一切检验水平为α的H皆有。若这样的检验存在,则称HR为检验水平α的一致最大功效检验,简称UMP检验。奈曼与皮尔森在1933年提出了著名的奈曼-皮尔森引理。这是对寻求UMP检验的一个构造性的结果,即
此时检验就是UMP检验。对某些也找到了 UMP检验,但并不是所有情况都存在 UMP检验。因此有必要在对检验作某些限制下寻找最大功效检验或建立另外一些优良性准则。
准则  要求检验在备择假设h1成立时作出正确判断的概率不小于检验水平α,这就是说在h0不成立时拒绝h0的概率要不小于在h0成立时拒绝h0的概率,这种性质称为无偏性,具有这种性质的检验称为无偏检验。显然,如果在无偏检验中存在一致最大功效检验就称为一致最大功效无偏检验(简称UMPU检验)。UMP检验不存在时,仍可能有UMPU检验存在。例如正态总体中未知时,为检验均值μ=μ0的t检验就是UMPU检验,但不是UMP检验。
因为假设检验在统计决策理论中是一种特殊的统计决策问题,两类错误影响可用特殊损失来表示。例如选取特殊的,使正确判断时损失为零,错判时损失为1。它就可归结为犯第一类错误的概率α和犯第二类错误的概率β。这同用功效函数Pθ(X∈HR)来叙述是一致的。
因此把统计决策理论中容许性、同变性、决策、最小化最大等概念引进来,而得到容许检验、同变检验、贝叶斯检验和最小化最大检验。在同变检验限制下,又可以建立一致最大功效同变检验的概念。这些准则又可作为假设检验的优良性准则,从而扩大了假设检验的内容。
寻求在一定准则下的最优检验是很困难的,何况这种最优检验有时并不存在。于是提出了若干依据直观的,其中最重要的是似然比法。
似然比检验
运用与最大似然估计(见)类似的原理,可得到似然比检验法。设样本X的分布密度即为l(尣,θ),θ∈嘷,欲检验的假设为h0:θ∈嘷0,称为似然比。显然0≤(尣)≤1,当(尣)太小时就拒绝h0,否则接受h0,其临界值λ0由检验水平α 和(尣)在h0成立时的分布确定,即。然而,在一般情况下,寻求(尣的精确分布并不容易。1938年S.S.威尔克斯证明了:在相当广泛的条件下,-2ln(尣)是渐近Ⅹ分布的, 这就为大样本的似然比检验提供了实行的可能。
用似然比法导出的重要检验有:
U检验  若总体遵从正态分布N(μ,σ),其中σ已知,X=(X1,X2,…,Xn)是从总体中抽取的简单随机样本,记,则遵从标准正态分布N(0,1),于是可考虑对μ的以下几种假设的检验,其中μ0是给定的常数,α为检验的水平,uα为标准正态分布的上α分位数。上述检验称为U 检验。
t检验  若总体服从正态分布N(μ,σ),但σ未知,记,,则t=遵从自由度为n-1的t分布,可对μ有以下的水平为α的检验,其中tα为自由度为n-1的t分布的上α分位数。这些检验称为t检验。
F检验 若X=(X1,X2,…,)及Y=(Y1,Y2,…,)分别为来自正态总体N(μ1,σ娝)及N(μ2,σ娤)的简单随机样本,记 ,,,,则遵从自由度为n1-1,n2-1的F分布,对比较σ娝与σ娤的假设有以下的水平为α的检验,其中Fα为自由度为(n1-1,n2-1)的F分布的上α分位数。
这些检验称为F检验,在方差分析中有广泛的应用。
参考书目  E.L.Lehmann,Testing Statistical Hypothesis,John Wiley & Sons, New
假设检验基本步骤
1、提出检验假设又称无效假设,符号是H0;备择假设的符号是H1。
H0:样本与总体或样本与样本间的差异是由抽样误差引起的;
H1:样本与总体或样本与样本间存在本质差异;
预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05或α=0.01。
2、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。根据资料的类型和特点,可分别选用Z检验,T检验,和等。
3、根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P&α,结论为按α所取水准不显著,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果P≤α,结论为按所取α水准显著,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。P值的大小一般可通过查阅相应的界值表得到。
教学中的做法:
1.根据实际情况提出原假设和备择假设;
2.根据假设的特征,选择合适的检验统计量;
3.根据样本观察值,计算检验统计量的观察值(obs);
4.选择许容显著性水平,并根据相应的统计量的统计分布表查出相应的临界值(ctrit);
5.根据检验统计量观察值的位置决定原假设取舍。
假设检验意义
假设检验是中的一项重要内容。它是根据原资料作出一个总体指标是否等于某一个数值,某一是否服从某种的假设,然后利用样本资料采用一定的统计方法计算出有关检验的统计量,依据一定的概率原则,以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检验方法。
用样本指标估计总体指标,其结论有的完全可靠,有的只有不同程度的可靠性,需要进一步加以检验和证实。通过检验,对样本指标与假设的总体指标之间是否存在差别作出判断,是否接受原假设。这里必须明确,进行检验的目的不是怀疑样本指标本身是否计算正确,而是为了分析样本指标和总体指标之间是否存在显著差异。从这个意义上,假设检验又称为显著性检验。
进行假设检验,先要对假设进行陈述。通过下例加以说明。
例如,设某工厂制造某种产品的某种精度服从为方差的,据过去的数据,已知平均数为75,方差为100。若经过技术革新,改进了制造方法,出现了平均数大于75,方差没有变更,但仍存在平均数不超过75的可能性。试陈述为统计假设。
根据上述情况,可有两种假设,(1) 平均数不超过75,(2)平均数大于75,即如果我们把(1)作为原假设,即被检验的假设,称作零假设,记作H0,如果其他假设相对于零假设来说,是约定的、补充的假设,则就是备择的,故称为备择假设或对立假设,记作H1。
还须指出,哪个是零假设,哪个是备择假设,是无关紧要的。我们关心的问题,是要探索哪一个假设被接受的问题。被接受的假设是要作为推理的基础。在实际问题中,一般要考虑事情发生的逻辑顺序和关心的事件,来设立零假设和备择假设。
在作出了统计假设之后,就要采用适当的方法来决定是否应该接受零假设。由于运用统计方法所遇到的问题不同,因而解决问题的方法也不尽相同。但其解决方法的基本思想却是一致的,即都是“概率反证法”思想,即:
(1)为了检验一个零假设(即虚拟假设)是否成立, 先假定它是成立的,然后看接受这个假设之后,是否会导致不合理结果。如果结果是合理的,就接受它;如不合理,则否定原假设。
(2)所谓导致不合理结果,就是看是否在一次观察中, 出现小概率事件。通常把出现小概率事件的概率记为0,即显著性水平。 它在次数图形中是两端或一端的面积。因此,从统计检验来说,就涉及到和单侧检验问题。在实践中采用何类检验是由实际问题的性质来决定的。一般可以这样考虑:
①。如果检验的目的是检验抽样的样本统计量与假设参数的差数是否过大(无论是正方向还是负方向),就把风险平分在右侧和左侧。比如显著性水平为0.05,即概率曲线左右两侧各占,即0.025。
②单侧检验。这种检验只注意估计值是否偏高或偏低。如只注意偏低,则临界值在左侧,称左侧检验;如只注意偏高,则临界值在右侧,称右侧检验。
对总体的参数的检量,是通过由样本计算的统计量来实现的。所以检验统计量起着决策者的作用。
与假设检验
统计推断是由样本的信息来推测母体性能的一种方法,它又可以分为两类问题,即参数估计和假设检验。实际生产和科学实验中,大量的问题是在获得一批数据后,要对的某一参数进行估计和检验。
例如,我们对45钢的作了测定,取得了一批数据,然后要求45钢断裂韧性的平均值,或要求45钢断裂韧性的单侧下限值,或要求45钢断裂韧性的分散度(即),这就是参数估计的问题。
又如,经过长期的积累,知道了某材料的的平均值和标准差,经改进热处理后,又测得一批数据,试问新工艺与老工艺相比是否有显著差异,这就是假设检验的问题。
这样可以看出,参数估计是假设检验的第一步,没有参数估计,也就无法完成假设检验。
假设检验应用
在雷达检测中,目标是产生假设的源,它可使用两个假设:H1和H0,分别表示目标存在(H1)和不存在(H0)。这是二元简单假设检验。二元数字通信问题也是简单假设检验。如果假设中含有目标未知参量,则是复合假设检验。m元通信问题也是复合假设检验。如果未知参量是随机变化的,则是随机参量信号的假设检验。
通信系统和雷达系统常用的最佳准则,是最小错误概率准则,即最大后验概率准则。以雷达检测为例:目标是源,它可使用的两个假设是H1和H0。接收端收到样本X(雷达回波)后,判定H1为真(目标存在),或判定H0为真(目标不存在概率可分别表示为p(H1/x)和p(H0/x),称为后验概率。最大后验概率准则的判决规则是,若
则判定H1为真(选择H1);否则判定H0为真。
假设检验注意的问题
1、做假设检验之前,应注意资料本身是否有可比性。
2、当差别有意义时应注意这样的差别在实际应用中有无意义。
3、根据资料类型和特点选用正确的假设检验方法。
4、根据专业及经验确定是选用单侧检验还是。
5、当检验结果为拒绝时,应注意有发生I类错误的可能性,即错误地拒绝了本身成立的H0,发生这种错误的可能性预先是知道的,即检验水准那么大;当检验结果为不拒绝无效假设时,应注意有发生II类错误的可能性,即仍有可能错误地接受了本身就不成立的H0,发生这种错误的可能性预先是不知道的,但与样本含量和I类错误的大小有关系。
6、判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。
7、报告结论时是应注意说明所用的统计量,检验的单双侧及P值的确切范围。
.生物谷&#91;引用日期&#93;
.六西格玛&#91;引用日期&#93;
.语文备课大师&#91;引用日期&#93;
本词条认证专家为
副理事长兼秘书长
中国通信学会
中国通信学会
原武汉邮电科学研究院
中国联通网络技术研究院
工业和信息化部电信研究院互联网中心
副院长兼总工程师
中国移动设计院
首席架构师业务总工程师
中兴通讯股份有限公司
百度公司发展研究中心
中国通信学会科普中国百科科学词条评审专家委员会
中国通信学会是全国通信...
提供资源类型:内容
清除历史记录关闭豆丁微信公众号
君,已阅读到文档的结尾了呢~~
统计推断原理和步骤,统计推断原理,实际推断原理,概率推断原理,描述统计和推断统计,视线高法的原理和步骤,linux启动步骤和原理,统计推断,免疫共沉淀原理及步骤,统计推断 pdf
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
统计推断原理和步骤
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='http://www.docin.com/DocinViewer--144.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口

我要回帖

更多关于 推断性统计 的文章

 

随机推荐