求助:参数检验与参数检验和非参数检验的区别别

当我们研究的样本处于良好情况下(近似正态、无离群点、数据量大等),传统的参数检验是很有效的。但是当这些前提条件不再满足时,参数检验就不再有效。此时人们往往求助于非参数检验,非参数检验不再关注数据的值,而只关注数据的秩,这样就抛弃了大量可用的信息。而置换检验采取重复随机抽样的方法,通过对样本再抽样构造经验分布,然后在此基础上生成P值进行推断,达到很好的效果。但要注意的是,如果样本不能很好的代表总体,任何检验方法都是无效的。以往进行置换检验可能需要编程,但在R语言中利用coin包和lmPerm可方便的进行这项工作。我们来构造两组数据来说明T检验、wilcox检验和置换检验的区别。score&-c(40,57,45,55,58,57,64,55,62,65)treatment&-factor(c(rep(&A&,5),rep(&B&,5)))mydata&-data.frame(treatment,score)library(lattice)stripplot(treatment~score,data=mydata)从上面的图形可以看到两组数据有差别,但这种差别是否显著呢,用三种方法分别来看一下P值,注意本例的置换检验函数是coin包中的oneway_testlibrary(coin)t.test(score~treatment,data=mydata,var.equal=T)wilcox.test(score~treatment,data=mydata)oneway_test(score~treatment,data=mydata,distribution='exact')可见T检验的P值为0.047,wilcox检验P值为0.09,而置换检验P值为0.07,由于样本数量只有十个,所以更倾向于相信置换检验。我们也可以对多组数据进行比较,还是利用multcomp包中的cholesterol数据集,首先绘图进行观察,然后分别用传统的方差分析函数aov,非参数的kruskal检验和lmPerm包中的置换检验函数aovp获得P值。library(multcomp)stripplot(trt~response,data=cholesterol)summary(aov(response~trt,data=cholesterol))kruskal.test(trt~response,data=cholesterol)library(lmPerm)summary(aovp(response~trt,data=cholesterol))在这个例子中,因为样本数据表现良好,所以参数检验和置换检验所得结论相近,P值都非常小而拒绝原假设。但非参数检验的信息利用不足,导致检验效能降低,无法检验出这种差别的存在。来源:http://www./lang/chinese/541R语言(Ryuyan360) 
 文章为作者独立观点,不代表大不六文章网立场
Ryuyan360【R语言】致力于传播R知识,包括【R每日一帖】、【R书籍推荐】、【R那些事】、【R微课程】、【R案例分享】、【陆勤读书笔记】等栏目。R语言可以帮助我们获取数据、处理数据、分析数据、展示数据和理解数据,以进行数据化决策!热门文章最新文章Ryuyan360【R语言】致力于传播R知识,包括【R每日一帖】、【R书籍推荐】、【R那些事】、【R微课程】、【R案例分享】、【陆勤读书笔记】等栏目。R语言可以帮助我们获取数据、处理数据、分析数据、展示数据和理解数据,以进行数据化决策!参考网友的资料进行总结:
参数检验与非参数检验的区别。
1)参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。
2)非参数检验:不依赖总体分布的具体形式和检验分布(如位置)是否相同。
参数检验与非参数检验的优缺点。
1)参数检验:优点是符合条件时,检验效率高;其缺点是对资料要求严格,如等级数据、非确定数据(>50mg)不能使用参数检验,而且要求资料的分布型已知和总体方差相等。
2)非参数检验:优点是应用范围广、简便、易掌握;缺点是若对符合参数检验条件的资料用非参数检验,则检验效率低于参数检验。如无效假设是正确的,非参数法与参数法一样好,但如果无效假设是错误的,则非参数检验效果较差,如需检验出同样大小的差异的差异往往需要较多的资料。另一点是非参数检验统计量是近似服从某一部分,检验的界值表也是有近似的(如配对秩和检验)因此其结果有一定近似性。
非参数检验适用那些情况?
(1)等级顺序资料。
(2)偏态资料。当观察资料呈偏态或极度偏态分布而有未经变量变换,或虽经变量变换但仍未达到正态或近似正态分布时,宜用非参数检验。
(3)未知分布型资料
(4)要比较的各组资料变异度相差较大,方差不齐,且不能变换达到齐性。
(5)初步分析。有些医学资料由于统计工作量过大,可采用非参数统计方法进行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容)
(6)对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。
常用参数检验方法:
1.正态总体均值的假设检验(t检验)
检验1组数据样本的均值是否等于,大于或小于某个值,或者检验两组数据样本的均值的大小情况。其中的统计量Z一般服从t分布。
2.正态总体方差的假设检验
检验1组数据样本的方差是否等于,大于或小于某个值,或者检验两组数据样本的方差的大小情况。其中单样本检验的统计量X2一般服从卡方分布。双样本检测的统计量F一般服从F分布。
3.二项分布总体的假设检验(非正态总体的假设检验)
非正态总体的假设检验有很多,二项分布总体的假设检验相对较为常用。常用于随机抽样实验的成功概率的检验。
常用的非参数检验方法:
1.Neyman-Pearson χ2 拟合优度检验
检验样本数据是否符合某种分布,Neyman-Pearson 拟合优度检验是非常重要的非参数检验方法, 既可以用于检验数据的分布特性,又可以检验不同组数据之间的分布关系(是否是同一分布)。
2.Kolmogorov-Smirnov检验
也是一个相当重要的检验方法,和Pearson方法一样属于拟合优度检验方法。但是Kolmogorov-Smirnov方法无需对要检验的数据分组,且使用经验累积分布函数(ECDF)来定义统计量,可以用于任何分布的检验。但Kolmogorov-Smirnov只适用于一元分布的情况。因此适用面与Pearson方法相比稍小。
3.独立性检验
很重要的检验方法,具体有Pearson卡方检验,Fisher精确独立性检验。这些检验方法通常用于检验数据的分布和假设影响因素的关系。
4.符号检验和秩和检验
检验样本与总体的情况,或样本总体间的差异。
参考知识库
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:1639次
排名:千里之外您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
第5章参数检验与非参数检验资料.ppt73页
本文档一共被下载:
次 ,您可全文免费在线阅读后下载本文档。
文档加载中...广告还剩秒
需要金币:350 &&
你可能关注的文档:
参数检验与非参数检验 本章内容 第一节
概述 第二节
均值比较与参数检验 第三节
非参数检验 第一节
一、参数检验与非参数检验 参数检验是指当总体分布已知的情况下,根据样本数据对总体分布的统计参数(如均值、方差等)进行推断。 非参数检验是当总体分布未知的情况下,根据样本数据对总体的分布形式或特征进行推断。 二、第Ⅰ类错误、第Ⅱ类错误与显著性水平 在进行统计推断时,有可能会出现以下两种错误,第一类错误是拒绝真实的原假设,我们把它叫做“拒真”的错误。第二类错误是接收错误的原假设,我们把它叫做“取伪”的错误。在假设检验中,犯第Ⅰ类错误的概率记为
,称其为显著性水平;犯第Ⅱ类错误的概率记为
。 我们一般事先规定允许犯第Ⅰ类错误的概率
,然后尽量减少犯第Ⅱ类错误的概率
。一般取 0.10、0.05或0.01,表示概率小的程度。
三、假设检验的基本步骤 1、根据推断检验的目标,对待推断的总体参数或分布作一个基本假设; 2、利用收集到的样本数据和基本假设计算某检验统计量,该统计量服从或近似服从某种统计分布; 3、根据该统计量的值得到相伴概率 值; 4、做出判断。研究者给定一个显著性水平,如果相伴概率值小于或等于用户给定的显著性水平,则拒绝原假设;否则,不应拒绝原假设。 第二节
均值比较与参数检验 一、均值比较 (一)均值比较的概念和基本步骤 统计分析常常采取抽样研究的方法,即从总体中随机抽取一定数量的样本进行研究来推论总体的特性。能否用样本均数估计总体均数?两个变量均数接近的样本是否来自均值相同的总体?这就要进行均值比较。 均值比较的基本步骤为: 第一步,用户指定一
正在加载中,请稍后...后使用快捷导航没有帐号?
查看: 2602|回复: 65
非参数检验与卡方检验
论坛徽章:81
就以下其中一个或多个问题进行讨论
& & & & 1. 探究非参数检验现在的发展现状,优势与发展障碍
& & & & 2. 卡方检验的适用的各种场景
& & & & 3. 本周内容相关的问题探讨
1、本周互动作业请在当前主题帖内进行发布,其他版块发起回复贴无效。
2、回复内容需符合主题帖讨论方向,灌水或者复制他人回帖,管理员及老师可以删除此贴,并判处作业不合格。
3、发起回帖需符合:1个回帖,字数不少50个字符的帖子。
金牌会员, 积分 2076, 距离下一级还需 924 积分
论坛徽章:32
3. 本周内容相关的问题探讨
其实也不是探讨,只是讲下感受,本周课件中最后的部分,也是就课上没有讲到的部分看起来似乎挺有意义的,因为普通的卡方检验是二因素比较,其它疑似的混杂因素并没有考虑,而课件后面的Mantel-Haenszel分层卡方检验没有讲好可惜。还有配对卡方检验,课件中提到了适用于四格表的McNemar检验,我想问如果是多值响应的分类变量又该用什么检验呢?
论坛徽章:28
卡方分布:
处理四格表数据是卡方检验最为常见的用途之一,其目的在于分析“构成比”或者“率”上的差异是否具有统计学意义。对于四格表数据,使用卡方检验的条件为样本量大于 40,且最小理论频数应大于 5。对于某些小样本的、或者指标阳性率较低的研究,总样本量可能小于 40,最小理论频数也可能小于 5,此时应该采用 Fisher 确切概率法进行分析。
高级会员, 积分 870, 距离下一级还需 130 积分
论坛徽章:28
1. 非参数检验的优点包括:对总体分布未做出任何假定,因此适用于任何分布的资料。如严重偏态分布、分布不明的资料、等级资料或末端无确定数值的资料;易于收集资料、统计分析比较简便。
缺点和发展障碍包括:不直接分析原始测量值,从而有可能会降低它的检验效率。满足参数检验要求的资料分析时应首选参数检验方法。不满足参数检验要求的资料应选非参数检验。此外就是计算量比较大。但随着计算机的广泛应用,这一缺点正被逐步克服
2. 卡方检验是对样本的频数分布所来自总体分布是否服从某种理论分布或某种假设分所所作的假设检验。卡方检验在多数情况下不是对总体参数的检验,而是对总体分布的假设检验。比如大学某系54位老年教师中,健康状况属于好的有15人,中等的有23人,差的有16人,问该校老年教师健康状况好 、中、差的人数比率是否为1:2:1?&&统计得P&0.05,所以该校老年教师的健康状况,好中差人数比率为1:2:1
论坛徽章:36
直接拿本周的例子讨论下,我是不是可以这样理解:首先做一个原假设,比如是相关的或者独立的,然后计算结果,如果P&0.05就是不能拒绝原假设,反之则拒绝原假设,那么如果最早选择的相关的则拒绝原假设就是独立的,反之依然,也就是2种方案得到2种结果来判断论证。第一次学,是不是没有理解错?
金牌会员, 积分 1253, 距离下一级还需 1747 积分
论坛徽章:12
非参数检验适用于随机样本,那如何判断样本是随机样本呢?
新手上路, 积分 23, 距离下一级还需 27 积分
论坛徽章:2
非参数检验的首要优点是对资料的要求不像参数检验那样严,能适于处理诸如非正态的、方差不齐的,截尾的、半定量的以及分布型不明确的等等资料,适用范围广泛。但对于符合参数检验条件的,采用非参数检验,损失部分信息,检验效能较低。
高级会员, 积分 735, 距离下一级还需 265 积分
论坛徽章:21
网上一篇文章写的不错,介绍了滥(乱)用卡方检验的情况:
1、处理四格表数据时不考虑样本量和最小理论频数而直接采用卡方检验
2、不考虑分析目的、设计类型而盲目套用卡方检验
3、误用卡方检验处理等级资料
4、对于多组资料反复使用卡方检验进行比较
几种常见的滥(乱)用卡方检验的情况 - 丁香园
高级会员, 积分 970, 距离下一级还需 30 积分
论坛徽章:6
1. 探究非参数检验现在的发展现状,优势与发展障碍
非参数检验就是在不了解总体的分布情况下的检验方法. 在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数检验”。
1.& & & & 由于非参数检验多总体的假定比较少,因而具有广泛的适用性,同时具有较好的稳健性。
2.& & & & 可以在较少的样本情况下进行,在一定的程度上弥补了有些情况下样本资料的不足的缺陷。
3.& & & & 对连续性变量和间断性变量都适用。
缺点:导致部分信息损失,降低检验效能。(在知道总体分布的情况下,最好不使用)
金牌会员, 积分 1151, 距离下一级还需 1849 积分
论坛徽章:7
非参数检验不考虑总体的参数和总体的分布类型,而是对样本所代表的总体的分布或分布位置进行假设检验。非参数检验的优点是使用范围广、对数据要求不严、方法简便、易于理解和掌握。缺点是会损失信息,检验效能低。

我要回帖

更多关于 参数检验和非参数检验的区别 的文章

 

随机推荐