n=0用用什么方法秩和检验n与T?

0 0 8 0 [ 摘要] R i d i t 分析与秩和秩和检验n与T都可對等级资料进行组间平均水平的比较但在实际工作中这两种方法如 何选用是一个值得探讨的问题。针对该问题通过例题对等级资料的R i d i t 分析及秩和秩和检验n与T方法进行解析以便医务 工作者能够根据数据自身特点及分析目的选择合适的统计学方法.获得等级资料间相互比较嘚正确结论。 [ 关键词] 等级资料;R i d i t a . K e yw o r d s r a n k e dd a t a ;R i d i ta n a l y s i s ;r a n ks u mt e s t 在医学研究特别是临床医学研究所获得的资 料中.常常遇到一些定性的测量指标.如疾病进展 的临床分期、病症严重程度的临床分级、患者预后 的不同水平等对这些指标常需将测量指标分成若 干个等级予以量化.然后分类计数反应各組病人的 具体状态。如随访资料的预后分为无效、好转、显 效、控制临床秩和检验n与T结果分为一、±、 、 、 ,疼痛 症状的严重程度分为0 無疼痛 、1 轻度 、2 中 [ 基金项目] [ 作者简介] [ 通讯作者】 中山大学教学改革研究课题重点资助项目 编号中大教务[ 2 0 0 9 ] 1 0 8 1 - 2 6 刘明华 1 9 8 6 一 将对秩和秩和检验n与T与R i d i t 分析在等级资料处理中的 应用进行比较。 1方法 1 1秩和秩和检验n与T 完全随机设计等级资料的秩和秩和检验n与T包括 两组样本的M a n n .W h i t n e y 秩和检验n与T和多組样本的 K r u s k a l .W a l l i s 髫秩和检验n与T。其基本思想是首先假定 各组总体分布的中心位置相同.然后对数据统一 编秩并求出秩和,最后计算相应的统計量.用于 刻画当前抽样结局所得组内秩和与矾成立时的 组内秩和的差距差距大于界值拒绝风。反之.不 拒绝矾 两组独立样本的比较,需计算的统计量为Z 万方数据 刘明华.等.R i d i t 分析与秩和秩和检验n与T在等级资料处理时的关系 2 8 3 z 擘些? √刀l 行2 Ⅳ 1 /1 2 ”7 式中n 为较小样本含量.n 2 為另一组的样本含量. N n , №r 为较小样本的秩和。当然凡。也可以使 用较大样本含量同时,丁替换为较大样本那一组 的秩和对样本含量的经验要求是.样本较小的那 一组,其样本含量大于l O .或者两组样本含量的 悬殊 砌一几 在1 0 以上。若各样本数据出现相同秩 次较多时 洳超过2 5 % 有校正Z c z /√c 。其中 c l 一∑ e - t j l n 3 - n 这里t j 为第_ 『次相同秩次 的个数 。 多组样本则计算的统计量为日 i o nu n i t .R i d i t 分析该方法首先需选定一 个标准组。如果有某一组例数明显多于其他组或者 该组为公认的参照组则选定该组为标准组如表l 以江剪刀草合剂为标准组[ t ] 当两组或多组间例数 相菦或都较少、也不能找到公认的标准组时,则以 各组对应等级内的合计作为标准 表2 中的全院疗 效的合计例数[ z 1 表1 ,2 ?m 3 表2 某医院各科疗效凊况 科室未愈死亡 内科 外科 妇产科 小儿科 综合科 传染科 神经科 肿瘤科 五官科 皮肤科 中医科0 2 8 3全院 式中Z 为各等级的合计数,J 7 、r 为总人数//1 , 為等级 的数目。 一y 尔 R 刍£一 4 式中厂为该组各等级的频数n 为该组的总人数。 标准组平均R i d i t 值等于0 .5 .其他各组与标准 组比较观察每个样本嘚9 5 %置信区间 式5 是否 与0 .5 重叠 是否包含0 .5 .以判断各处理与标准 组间的差异是否有统计学意义。 尺±2 S 鬲 R ±2 s , /4 // 5 式中蔡昌启;雷玉洁 等级资料Ridit分析及正确使用[期刊论文]-中国卫生统计 .卢林耿;王忠民 应用SAS软件处理等级资料Ridit分析[期刊论文]-中国卫生统计 200004

用秩号代替原始数据后所得某些秩号之和,称为秩和用秩和进行假设秩和检验n与T即为秩和秩和检验n与T。其秩和检验n与T假设在两组比较(成对或不成对)时H0:F(X1)=F(X2),即两总体的分布函数相等备择假设H1:F(X1)≠F(X2)。本法由于部份地考虑了数据的大小故秩和检验n与T效力较符号秩和检验n与T大大提高。至于其方法、步骤不论是查表法或计算法、也都相当简便,现举例说明如下

处理时可用查表法或计算法,今以例10.3分别说明如下

1.排队,将差数按绝对值从小至大排列并标明原来的正负号见表10.3第(5)栏,排队后与原豚鼠号已无对应关系

2.编秩号,成对资料编秩號时较为复杂要注意三点:

(1)按差数的绝对值自小至大排秩号,但排好后秩号要保持原差数的正负号;

(2)差数绝对值相等时要以岼均秩号表示,如表10.3中差数绝对值为4者共三人其秩号依次应为2、3、4,现皆取平均秩号3;

(3)差数为0时其秩号要分为正、负各半,若有┅个0因其绝对值最小,故秩号为1分为0.5与-0.5,若有两个0则第二个0的秩号为2,分为1与-1等等

3.求秩号之和即将正、负秩号分别相加,本例嘚正秩号之和为68负秩号之和为10,正负秩号绝对值之和应等于1/2n(n+1)可用以核对,如本例68+10=12/1(12+1)=78证明秩号计算正确。

4.以较小一个秩号之和(R)查附表12进行判断,该表左侧为对子数表身内部是较小秩号和,与上端纵标目之概率0.05,0.01相对应其判断标准是

例10.3 请以表10.1资料用秩和秩和檢验n与T处理之。

表10.3 豚鼠给药前后灌流滴数及其秩号

将表中10.1中用药前后的数据求出差数并按差数绝对值排队,结果见表10.3第(5)栏再编秩号,为计算方便正、负秩号分列两栏,见表10.3第(6)、(7)栏

今R0.05>R>R0.01,故0.05>P>0.01在概率0.05水平上拒绝H0,接受H1即用药前后的相差是显著的,给药後每分钟灌流滴数比用药前增多了

附表12中只列有n≤25时的临界值。当n值较大时亦可采用计算法

在计算法时,对差数的排队编秩号及求秩号之和同查表法,不同的是求得秩号之和以后的算所用公式是:

式中n为原始资料中数据的对子数,R为正秩号之和或负秩号之和为计算方便,通常取绝对值较小的秩号之和为r

据研究,当n大于10时上式算得的u近似正态分布,故计算法只用于n值较大时

因本例资料接近正態分布,故曾用t秩和检验n与T的个别比较方法处理过结果是:t=2.653 0.05>P>0.01,与秩和秩和检验n与T结论相同但与符号秩和检验n与T结论不同(χ2=2.083,P>0.05),说奣符号秩和检验n与T的秩和检验n与T效率比秩和与t秩和检验n与T都要低比较粗糙,而秩和秩和检验n与T的效率与t秩和检验n与T较接近

此法又称为wilcoxon氏两样本法。

处理时也可用查表法或计算法今以例10.4分别说明之。

1.各自排队统一编秩号,即将两组数据分别从小到大排列但编秩号時要两组统一进行,凡分属于两组的相等数据用平均秩号如本例0.042共三个,取平均序号皆为8

2.令较小样本秩号之和为r ,例数为n

3.计算R',公式为:

R'是同一个样本资料当秩号倒排(即由大至小)时较小样本秩号之和。

4.以R和R'两秩号之和中较小者与附表13中R的临界值仳较以作出判断,其标准仍是:

例10.4 请以表10.2资料用本法处理之

表10.4 九名健康人与八名铅作业工人的尿铅值(mg/L)

先将本表10.2中两组数据各洎排队并统一编秩号,结果见表10.4

较小样本为铅作业工人组,n1=8R=99,代入式(10.6)

R与R'两者中以R'较小故以P'值与附表13数值比较,得R0.05=51R0.01=45;今R'=R0.01,故P=0.01在α=0.05水平上拒绝H0,接受H1差别显著,故铅作业工人尿铅值比健康人高

两组资料比较时,也可用计算法用计算法时,对两组数據各自排队、统一编秩号同查表法不同的是求得秩号之和以后计算,公式是:

为便于计算和前后符号一致n1作为较小样本例数,R为较小樣本的秩和n2则为较大样本的例数。

据研究当n1、n2都大于8时,算得的u近于正态分布若例数太少,则以查表法更为精确

本例如用t秩和检驗n与T的团体比较处理,则t=3.169,P<0.01二者结论一致,但与符号秩和检验n与T结论不同(χ2=2.930,P>0.05)同样说明符号秩和检验n与T较粗糙秩和检验n与T效率低,而秩和秩和检验n与T与t秩和检验n与T的结论较近

三、两组等级资料的比较

等级资料又称为半计量资料,当两组等级资料比较时用秩和秩和检驗n与T来比较其相差是否显着比用χ2秩和检验n与T要恰当。两组等级资料通常例数都较多,故一般都用计算法其步骤与两组资料的秩和秩囷检验n与T相似,不同的是要求各等级的平均秩号为此,先要求得各等级的秩号范围今举例10.5说明之。

1.求各等级的平均秩号为此,先偠求出各等级的秩号范围如等级“-”共18+8=26例,共秩号范围自1~26要注意的是各等级的秩号范围必须紧相联接。最后一组秩号范围的上限一萣等于两组例数之和求得各等级秩号范围后,再求其下限和上限的平均即可算得平均秩号,如等级“一”的平均秩号为(1+26)/2=13.5余类推。

2.求出R及其n1为计算方便,把例数少的正常人组的秩号之和作为R其例数为n1得R=308n1=20,n1=32

3.代入式(10.7)得u值即可作结论。

例10.5今有20名正常人和32洺铅作业工人尿棕色素定性检查结果如下表10.5,试问其相差是否显著

表10.5 20名正常人和32名铅作业工人尿棕色素定性检查结果

多组资料的比较吔是从排秩号开始,但不是直接用秩和进行秩和检验n与T有的书籍称之为秩秩和检验n与T(rank test),以示与秩和秩和检验n与T有别其秩和检验n与T假设也较复杂:在处理完全随机设计的资料时,H0:F(X)=F(X2)=F(X3)=……即比较的各样本所对应的各总体的分布函数相等,H1:各总体的汾布函数不相等或不全相等;在处理随机单位组设计的资料时H0:P(χij=r)=1/n,即内组各秩号r之概率相等都是1/n(r=1,2……,n)而H1为:P=(χij=r)≠1/n

洇不同实验设计所得资料的处理也有别,故下面分别举例说明之

(一)完全随机设计所得资料的比较

用的方法是单因素多组秩秩和检验n與T,称为Kruskal-Wallis氏法或H秩和检验n与T。其计算步骤如下

1.各自排队,统一编秩号即将各组数据在本组内从小到大排队,见表10.6各含量栏再将各組数值一起考虑编出统一秩号,见表10.6各“秩号”栏分属不同组的相同数值用平均秩号;

2.求各组秩号之和R1以及各组数n1

3.代入下式计算H值:

式中N为各组例数之和,Ri和ni为各组的秩号之和以及例数:

当比较的组数多于三组或组数虽只有三组但每组例数大于5时,H值的分布近于自由喥等于组数-1的χ2分布故可用对应的χ2值作界值。当三组比较时每组例数均不超过5时H值与χ2值有较大偏离,此时可查附表14直接查得H0.05和H0.01

例10.6 雄鼠20只随机分为四组第1、2组在皮肤上涂用放射性锡(Sn113)标记的三乙基硫酸锡,涂后将皮肤暴露于空气中;第3、4组涂药后用密闭小箥璃管套使皮肤与外界空气隔开三小时后杀死,测肝中放射物结果如表10.6,试比较各组含量间有无显著相差

表10.6 白鼠皮肤涂药后,肝Φ放射性Sn113的含量

各组资料各自排队统一编秩号,以及求各组的秩号之和Ri和例数ni见表10.6

(二)随机单位组设计所得资料的比较

用的方法是双洇素多组秩秩和检验n与T即Friedman氏法。

处理这种资料时可分成两步对两个因素分别进行秩和检验n与T。现用例10.7说明其计算步骤:

先比较四种防護服对脉搏的影响

1.将穿四种防护服的每一受试者的脉搏数从小到大编秩号当数值相等时用平均秩号,见表10.7各秩号栏

2.求各防护服组秩号之和Ri

当t>4或t=4且b>5或t=3且b>9时,H值的分布近于自由度ν=t-1时的χ2分布故可查相应的χ2值与H值比较作出判断:如t、b不能满足上述条件,则所算得的H徝与χ2分布有较大偏离需查附表15作判断。

例10.7 受试者5人每人穿四种不同的防护服时的脉搏数如表10.7,问四种防护服对脉搏的影响有无显著差别又五个受试者的脉搏数有无显著差别?

表10.7 比较穿四种防护服时的脉搏数(次/分)

排队、编秩号、求各比较组的Ri见表10.7所示

将表10.7Φ各数代入式10.9,得

再比较五名受试者的脉搏数:

将数据列出(同表10.7)但秩号是按每种防护服中受试者脉搏的数值从小到大编定,然后求絀各受试者秩号之和R详细见表10.8

表10.8 比较五名受试者的脉搏数

将表10.8 所得各数据代入式10.9得

五、多组资料间的两两比较

当多组间的差别显着時,则需进一步判断那些组之间的差别有显着性这个问题的解决方法与第八章第二节中的多个均数间的两两比较很相似,在例10.6四个实验組涂放射性锡的例子中结果为H>χ20.01,3,P<0.01现以此为例,进一步作各组两两间比较步骤如下:

1.将各组秩和从大到小依次排队,并求得两两間的相差见表10.9

2.计算标准误,计算公式是:

式中σ为任意两个秩和之差的标准误,n为各组例数a为处理数,此式要求各组例数相等

3.查q值表定界限作结论

仍查方差分析时用的q值表,v→∝

各q值须与处理数相同的标准误相乘如处理数为2的q值要乘以处理数为2时的标准误,2.77×6.77=18.75,3.64×6.77=24.64等余类推。

例10.6资料两两间比较如下:

表10.9 每两组秩和之间的相差及其显著性

计算标准误:n=5用式10.10

两两比较后的结论见表10.9所示,结合起來看结论是:涂湿药的比涂干药肝中放射性Sn113含量要高,涂湿药中密闭的比敞开的含量高。

我要回帖

更多关于 smirnov检验 的文章

 

随机推荐