医学统计学求非正态分布 过程能力法的过程具体过程

第三节 正常值范围的估计(正态分布|百分位数|样本数据) - 生物医学 - 生物秀
第四章 正态分布与正常值范围估计第三节 正常值范围的估计在医学科研中有时需要根据样本数据推论总体中个体值范围,其中最常用的是估计正常值范围。一、正常值范围的意义正常人体的解剖、生理、生化、心理等各种数据的波动范围称正常值范围,简称正常值。如成人白细胞总数的正常值为4000~1…… [关键词:正态分布 百分位数 样本数据 样本含量 波动 假阴性 药物]">
标题: 第三节 正常值范围的估计(正态分布|百分位数|样本数据)
摘要: [第三节 正常值范围的估计(正态分布|百分位数|样本数据)]《医学统计学》 > 第四章 正态分布与正常值范围估计第三节 正常值范围的估计
在医学科研中有时需要根据样本数据推论总体中个体值范围,其中最常用的是估计正常值范围。一、正常值范围的意义
正常人体的解剖、生理、生化、心理等各种数据的波动范围称正常值范围,简称正常值。如成人白细胞总数的正常值为4000~1…… [关键词:正态分布 百分位数 样本数据 样本含量 波动 假阴性 药物]……
《医学统计学》 > 第四章 正态分布与正常值范围估计第三节 正常值范围的估计
在医学科研中有时需要根据样本数据推论总体中个体值范围,其中最常用的是估计正常值范围。
一、正常值范围的意义
正常人体的解剖、生理、生化、心理等各种数据的波动范围称正常值范围,简称正常值。如成人白细胞总数的正常值为个/mm3。以一定数量“正常人”为样本,观察某个或几个变量,根据所得样本数据,推论总体中变量值的范围,称正常值范围估计。一些与人体有关的外界环境如噪音强度、粉尘浓度、昆虫密度、水中微量元素的含量等,在某一地域、某段时期内亦在一定范围内波动;某病患者在病程的某段时期内,某种检验结果亦常在一定范围内波动。虽然这些范围不一定是正常的,有的超过了卫生标准或正常值,但若从样本数据估计总体中变量值的范围来说,那么也可以用本章的估计方法,得出的波动范围可称为个体值范围。
二、确定正常值范围的一般原则和步骤
1.确定研究总体。即对研究总体的同质性基础作出规定。以“正常人”为例,所谓正常人不是指任何组织与器官的形态及机能都无异常的人,而是指排除了影响被研究指标的疾病和有关因素的人。例如某单位研究血清谷一丙转氨酶活性的正常值,选取“正常人”的条件为无肝、肾、心、脑、肌肉等器质性疾患,近期无特殊用药史(如氯丙嗪、异烟肼等),测定前未作剧烈运动等。上述条件就是保证研究对象的同质性作出的规定。但不允许以所研究指标值的大小来划分是否“正常人”。对研究总体,如“正常人”的规定要根据研究目的、技术力量与水平以及人力物力等条件来考虑,往往牵涉到多方面的专业知识。但一般可从地区、民族、性别、年龄、劳动条件(如是否与有害物质接触)、时间(季节与昼夜)、月经、妊娠、饮食、药物、生活习惯等来考虑。例如红细胞数及血红蛋白量,高原居民与平原不同,男子各异;人体血清胆固醇含量随年龄的增长而增加,妊娠期高于非妊娠期,冬季高于夏季,且受饮食影响;服用某些药物可直接增加检测的有关成分或干扰检测结果的准确性。各种影响因素,有些可通过询问与体检严格控制,如排除那些与被研究指标有关的各病患者,或处于妊娠、经期的妇女,近期内服用某种药物者等;有些可用对调查资料分组统计的办法加以控制或研究。如先按男、女分别统计,然后检验两组数据的分布、均数与标准差等,有无差别,若有差别则分别求正常值,否则可合并求通用的正常值。2.确定观察例数。正常值范围的影响因素复杂,要使样本分布能正确估计总体分布,例数不能太少,一般认为应在200例左右。数据变异不大,观测比较精确的,例数可相应少些;影响因素复杂、数据变异大,观测方法不够稳定的,例数相应要多一些。但要防止片面追求数量,而抽选样本不按规定,观测方法不统一,粗率马虎,以致影响原始数据的可靠性。3.统一测定方法,控制实验误差,保证数据的可靠性。为达到上述要求应注意对检测人员(医生、检验人员等)的培训,以统一认识、统一方法和操作,标准化和,建立质量控制防止记录差错等。但也要尽量与应用正常值范围时的实际情况相一致,例如临床检验每一个标本只作一次,那么为确定正常值的检验每个标本亦只作一次,不能作两个平行样本求平均数后再估计正常值。否则可能定出的正常值范围较窄。4.确定取单侧还是双侧界值。某些指标如白细胞总数,无论过低或过高都不正常,因此需要确定下限和上限两个界值,称双侧界值。有的指标如肺活量一般只认为过低是不正常,所以只需定下测界值,即下限;但血铅只是过高不正常,只需定上限。只需定下限或上限的,称单侧界值。确定取单侧还是双侧界值,应根据业务知识与指标用途。5.确定适当的百分范围。调查一定数量的正常人若以某指标的最小、最大值作为正常值范围,常因调查例数的增加等遇到少数极端值,使正常值范围不稳定。因此统计上常采用一些方法,删去一定比例的极端值,使得出的正常值能较稳定地反映绝大多数正常人该指标的数值。那么绝大多数是指正常人的百分之多少呢?一般包括正常人的80%、90%、95%或99%等。这样,若按单侧计算,相应地将有20%、10%、5%或1%的正常人该指标值在正常值范围以外;若按双侧计算,相应地,过高、过低者各有10%、5%、2.5%或0.5%。这些指标值在正常值范围以外的正常人,将被错判为不正常。将正常错判为不正常,称为I型错误,或假阳性,其假阳性率或误诊率用α表示。但亦有些病人的指标值,可能落在正常值范围以内,这时就会将病人错判为正常人,这种错判Ⅱ型错误,或假阴性,假阴性率即漏诊率用β表示。确定合适的百分范围应根据研究目的,结合正常人和病人的数值分布,同时考虑α及β,一般有下列两种情况:(1)正常人和病人的数据分布无重叠(见图5.4a)。这时只考虑减少α;(2)正常人和病人的数据分布有重叠(见图5.4b)。这时两分布重叠部分内既有病人亦有正常人,若欲减少α,界值向右移,那么β将加大;若欲减少β,界值向左移,那么α将加大。通常兼顾α及β,取两曲线交点的横座标为界值,这时α与β之和为最小。但实用时还要考虑该正常值范围的主要用途,若用以普查初筛病人,则要减少假阴性,取80%或90%正常值范围;若用以确诊病人,则要避免假阳性,以取95%或99%正常值范围为宜。图 5.4 正常人和病人数据分布示意图6.确定估计方法进行估计。估计正常值范围的方法较多,主要根据频数的分布类型和样本含量选用。常用的有百分位数法和正态分布法。运用百分位数法的条件是样本含量大,适用正态分布法的条件是资料服从正态分布或经过转换后服从正态分布。此外尚有曲线拟合法等。
三、确定正常值范围的方法
1.百分位数法。本法根据正常人样本数据,按照选定的百分范围计算相应的百分位数作为正常值范围的界值。可根据原始数据直接计算,亦可根据频数表进行计算。计算步骤为:(1)按已确定的百分范围从表5.1查得应计算的百分位数;(2)计算出各百分位数的所在位置;(3)代入公式计算界限Px表5.1 估计正常值范围的计算项目百分范围(%)百分位数法正态分布法双侧单侧 下(或上)限双侧单侧下(或上)限 80P10及P90P20(或P80)X±1.282SX-(或+)0.842S90P5及P95P10(或P90)X±1.645SX-(或+)1.282S95P 2.5及P97.5P5(或P95)X±1.960SX-(或+)1.645S98P1及P99P2(或P98)X±2.326SX-(或+)2.054S99P0.5及P99.5P1(或P99)X±2.576SX-(或+)2.326S例5.2 某地测得200例健康成人的血铅值(微克/100克)得频数分布如下,试估计单侧95%上限。(1)查表5.1,百分范围95,百分位数法,单侧上限应求P95。(2)求P95的位置200×0.95=190即为第190个数据处,因此知A=188,Lx=35,fx=4,ix=5。代入公式(4.5)表5.2 百分位数法计算单侧上限(200例健康成人的血铅值)血铅值(微克/100克)频数累计频数0-665-485410-439715-3613320-2816125-1317430-1418835-419240-419645-119750-219955-019960-1200合计200-健康成人血铅值的95%正常值上限为37.5微克/100克。若根据原始资料计算,已算得Px的位置为第190个数据后,将原始数据从大至小排,第10个数据的值即为Px。此法的优点是不拘资料的分布类型,计算简便,样本含量较大,分布较稳定时结果稳定。但估计结果受样本极差的限制,受两侧尾部数据的影响较大,尤其是百分范围较大(如大于95%)。样本含量不够在时,结果不够稳定。2.正态分布法。正态分布法运用正态曲线下面积与μ±μασ的关系来估计数值范围的。在图5.2中曾提到μ±1.96σ的范围内包含了曲线下总面积的95%,亦就是总例数的95%。在此范围外则有2.5%的例数其数据值大于μ±1.96σ,另2.5%小于μ-1.96σ。因此,就可用μ±1.96σ来估计双侧95%的正常值范围。同理可用μ与相应的μασ 估计所需百分范围,μ可从附表2查得。但在实际中μ与σ常常是不知道的,只能用它们的估计值X与S来代替。估计正常值范围时常用的百分范围与相应的X±us见表5.1。用正态分布法估计正常值范围的公式为X±uαs (5.4)例5.3 测得西安市7岁男童102人坐高,X=66.72,S=2.08,试用正态分布法估计双侧95%正常值范围。查表5.1,百分范围95,正态分布法双侧,应求X±1.96S。代入公式(5.4)66.72±1.96×2.08=(62.8)西安市7岁男童坐高的95%正常值范围为62.6~70.08公分。此法适用于正态分布资料,样本均数和标准差比较稳定者,其优点是结果稳定,受两端尾部数据影响较小,也不受样本数据极差的限制,缺点是只适用于正态分布资料。医学上不少资料呈偏态分布,但计算较繁。
相关热词:
生物秀是目前国内最具影响力的生物医药门户网站之一,致力于IT技术和BT的跨界融合以及生物医药领域前沿技术和成功商业模式的传播。为生物医药领域研究人员和企业提供最具价值的行业资讯、专业技术、学术交流平台、会议会展、电子商务和求职招聘等一站式服务。
官方微信号:shengwuxiu
电话:021-&&&&医学统计方法(第三版)(共用课)
钻石会员自营订单满49元(含)免运费
其他会员自营订单满59元(含)免运费
不足金额订单收取运费5元起
邀请好友参加吧
版 次:1页 数:字 数:印刷时间:日开 本:16纸 张:胶版纸印 次:1包 装:平装是否套装:国际标准书号ISBN:3丛书名:教育部职业教育与成人教育司规划教材所属分类:&&&&&&&&
本商品暂无详情。您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
医学统计学课件--第二章正态分布.ppt37页
本文档一共被下载:
次 ,您可免费全文在线阅读后下载本文档
文档加载中...广告还剩秒
需要金币:100 &&
你可能关注的文档:
··········
··········
医学统计学 第二章
计量资料的统计描述
Normal distribution
正态分布 概述
正态分布是描述连续型变量值分布的曲线,医学上许多资料近似服从正态分布。
正态分布在统计推断上有重要的作用。
直方图的频数分布与正态分布
(见图2-4)
一、正态分布的概念和特征 1.正态分布曲线的数学函数表达式:
2、正态分布曲线理论上的特征 (1)以X
μ为中心, X值呈钟型分布对称性减少。 (2 )在 X
μ处,f(x)取最大值。 (3 )正态分布由μ 、σ决定 正态分布的位置和形状。
随μ 不同,曲线位置不同,称μ为位置参数。σ越大,曲线形状不同, 称σ为形状参数。 实例 例1:中国成年人平均身高(μ) 男性 1.7米,女性 1.59米
例2:正常人平均舒张压值
μ 80(mmhg)
高血压病平均舒张压值
μ 100 (mmhg ) 4.曲线下x值的分布面积在医学应用非常重要,面积可对公式2-18式积分实现:
正态分布曲线下面积的含义
1.表示变量值(x)在a-b区间变量值所占全部(总体)变量值的比例或概率 p 。
2变量值在整个曲线下的面积为100%,或出现的概率为1。 表2-1
101名正常成年女性血清总胆固醇频数表
正在加载中,请稍后...君,已阅读到文档的结尾了呢~~
医学统计学正态分布(已处理),统计学 正态分布,正态分布,标准正态分布,正态分布表,对数正态分布,标准正态分布表,正态分布函数,二维正态分布,正态分布公式
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
医学统计学正态分布(已处理)
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口医学统计学练习题及答案-海文库
全站搜索:
您现在的位置:&>&&>&从业资格考试
医学统计学练习题及答案
练 习 题 答 案
医学统计中的基本概念
练 习 题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件
B. 各种类型的数据C. 动物和人的本质
D. 疾病的预防与治疗 E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体
B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体
D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值
B.脉搏数C.住院天数
D.病情程度 E.四种血型4. 随机误差指的是A. 测量不准引起的误差
B. 由操作失误引起的误差C. 选择样本不当引起的误差
D. 选择总体不当引起的误差 E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差
B. 系统误差C. 过失误差
D. 记录误差 E.仪器故障误差
1答案: E E D E A二、简答题1. 常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。2. 抽样中要求每一个样本应该具有哪三性?[参考答案]从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。(1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。(2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。需要作“样本例数估计”。23. 什么是两个样本之间的可比性?[参考答案]可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。(马斌荣)第二章
集中趋势的统计描述
练习题一、单项选择题1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是A. 中位数
B. 几何均数C. 均数
D. P95百分位数E. 频数分布2. 算术均数与中位数相比,其特点是A.不易受极端值的影响
B.能充分利用数据的信息C.抽样误差较大
D.更适用于偏态分布资料
E.更适用于分布不明确资料3. 一组原始数据呈正偏态分布,其数据的特点是A. 数值离散度较小
B. 数值离散度较大C. 数值分布偏向较大一侧
D. 数值分布偏向较小一侧
E. 数值分布不均匀4. 将一组计量资料整理成频数表的主要目的是A.化为计数资料
B. 便于计算C. 形象描述数据的特点
D. 为了能够更精确地检验 E. 提供数据和描述数据的分布特征35. 6人接种流感疫苗一个月后测定抗体滴度为 1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选用的指标是A. 均数
B. 几何均数C. 中位数
D. 百分位数E. 倒数的均数答案: A B D E B二、计算与分析1. 现测得10名乳腺癌患者化疗后血液尿素氮的含量(mmol/L)分别为3.43,2.96,4.43,3.03,4.53,5.25,5.64,3.82,4.28,5.25,试计算其均数和中位数。[参考答案]?3.43+2.96+4.43+3.03+4.53+5.25+5.64+3.82+4.28+5.25?4.26 (mmol/L)104.28+4.43?4.36 (mmol/L) 2
M?2. 某地100例30-40岁健康男子血清总胆固醇值(mg/dl)测定结果如下:
202 165 199 234 200 213 155 168 189 170 188 168 184 147 219 174 130 183 178 174
228 156 171 199 185 195 230 232 191 210 195 165 178 172 124 150 211 177 184 149
159 149 160 142 210 142 185 146 223 176 241 164 197 174 172 189 174 173 205 224
221 184 177 161 192 181 175 178 172 136 222 113 161 131 170 138 248 153 165 182
234 161 169 221 147 209 207 164 147 210 182 183 206 209 201 149 174 253 252 156(1)编制频数分布表并画出直方图;(2)根据频数表计算均值和中位数,并说明用哪一个指标比较合适;(3)计算百分位数P、P25、P和P。 57595[参考答案](1)编制频数表:某地100例30-40岁健康男子血清总胆固醇值的频数表甘油三脂(mg/dL)(1)频数 (2) 4 累积频数 (3) 累积频率 (4)110~
125~ 140~ 155~ 170~ 185~ 200~ 215~ 230~ 245~ 合计2
411 16 27 12 13
10026 17 33 60 72 85 92 97
6 17 33 60 72 85 92 97
100―画直方图:
图 某地100例30-40岁健康男子血清总胆固醇值的频数分布 (2)计算均数和中位数:?(110 +7.5)?2 +(125 +7.5)?4 ?+(245 +7.5)?3?182.9(mg/dl)100M?P50?170?100?0.5?33?15?179.4(mg/dl)275从上述直方图能够看出:此计量指标近似服从正态分布,选用均数较为合适。(3)计算百分位数:P5?125?100?0.05?2?15?136.25(mg/dl)??4 100?0.25?17?15?162.5(mg/dl)16 100?0.75?72?15?203.5(mg/dl)13
P25?155?P75?200?100?0.95?92?15?239(mg/dl)5
3. 测得10名肝癌病人与16名正常人的血清乙型肝炎表面抗原(HBsAg)滴P95?230?度如下表,试分别计算它们的平均滴度。肝癌病人与正常人的血清乙肝表面抗原(HBsAg)滴度 滴度倒数
256[参考答案]肝癌病人与正常人的血清乙肝表面抗原(HBsAg)滴度测定结果肝癌病人数(f2) 滴度倒数(X) 正常人数(f1)8 16 32 64
正常人数75 1 3 0 0肝癌病人数12 3 2 1 1lgx 0.90 1.20 1.50 1.81f1lgx f2lgx7 5 1 31 2 3 266.30 6.00 1.50 5.430.90 2.40 4.50 3.62128 256 合计0 0161 1102.11 2.41 -0.00 0.00
19.232.11 2.41
15.94?19.23??1?15.94?G1?lg?1??15.92G?lg2????39.26?16??10?正常人乙肝表面抗原(HBsAg)滴度为1: 15.92 肝癌病人乙肝表面抗原(HBsAg)滴度为1:39.26(李 康)第三章 离散程度的统计描述练 习 题一、单项选择题1. 变异系数主要用于A.比较不同计量指标的变异程度
B. 衡量正态分布的变异程度 C. 衡量测量的准确度
D. 衡量偏态分布的变异程度 E. 衡量样本抽样误差的大小2. 对于近似正态分布的资料,描述其变异程度应选用的指标是A. 变异系数
B. 离均差平方和
D. 四分位数间距
E. 标准差3. 某项指标95%医学参考值范围表示的是A. 检测指标在此范围,判断“异常”正确的概率大于或等于95%
B. 检测指标在此范围,判断“正常”正确的概率大于或等于95% C. 在“异常”总体中有95%的人在此范围之外 D. 在“正常”总体中有95%的人在此范围E. 检测指标若超出此范围,则有95%的把握说明诊断对象为“异常”
74.应用百分位数法估计参考值范围的条件是A.数据服从正态分布
B.数据服从偏态分布
C.有大样本数据
D.数据服从对称分布
E.数据变异不能太大5.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用A.全距
C.变异系数
E.四分位数间距答案:A E D B E 二、计算与分析1. 下表为10例垂体催乳素微腺瘤的病人手术前后的血催乳素浓度,试说明用何种指标比较手术前后数据的变异情况较为合适。表
手术前后患者血催乳素浓度(ng/ml)血催乳素浓度例号 1 2 3 4 5
6 7 8 9 10[参考答案]
8术前 276 8801600324 398 266 5001760500 220术后41 110 280 61 105 43 25 300 215 92血催乳素浓度术前均值=672.4 ng/ml,术后均值=127.2 ng/ml。手术前后两组均值相差较大,故选择变异系数作为比较手术前后数据变异情况比较合适。 术前:?672.4,S?564.65CV?564.65?100%?83.98% 672.4术后:?127.2,S?101.27
CV?101.27?100%?79.61% 127.2可以看出:以标准差作为比较两组变异情况的指标,易夸大手术前血催乳素浓度的变异。2. 某地144例30~45岁正常成年男子的血清总胆固醇测量值近似服从均数为4.95mmol/L,标准差为0.85mmol/L的正态分布。①试估计该地30~45岁成年男子血清总胆固醇的95%参考值范围;②血清总胆固醇大于5.72mmol/L的正常成年男子约占其总体的百分之多少?[参考答案]①正常成年男子的血清总胆固醇测量值近似服从正态分布,故可按正态分布法处理。又因血清总胆固醇测量值过高或过低均属异常,所以应计算双侧参考值范围。 下限:?1.96S?4.95?1.96?0.85?3.28(mol/L) 上限:?1.96S?4.95?1.96?0.85?6.62(mmol/L)即该地区成年男子血清总胆固醇测量值的95%参考值范围为3.28 mmol/L~6.62 mmol/L。②该地正常成年男子的血清总胆固醇测量值近似服从均数为4.95mmol/L,标准差为0.85mmol/L的正态分布,计算5.72mmol/L对应的标准正态分布u值:u?5.72?4.95?0.91 0.85问题转化为求u值大于0.91的概率。由于标准正态分布具有对称性,所以u值大于0.91的概率与u值小于-0.91的概率相同。查附表1得,?(?u)?0.1814,所以说血清总胆固醇大于5.72mmol/L的正常成年男子约占其总体的18.14%。
93. 某地200例正常成人血铅含量的频数分布如下表。 (1)简述该资料的分布特征。(2)若资料近似呈对数正态分布,试分别用百分位数法和正态分布法估计该地正常成人血铅值的95%参考值范围。表
某地200例正常成人血铅含量(μmol/L)的频数分布 血铅含量 0.00~ 0.24~ 0.48~ 0.72~ 0.96~ 1.20~ 1.44~ 1.68~ 1.92~ 2.16~ 2.40~ 2.64~频 数 7 49 45 32 28 13 14 4 4 1 21累积频数
161 174 188 192 196 197 199200
[参考答案](1)从表可以看出,血铅含量较低组段的频数明显高于较高组段,分布不对称。同正态分布相比,其分布高峰向血铅含量较低方向偏移,长尾向血铅含量较高组段延伸,数据为正偏态分布。某地200例正常成人血铅含量(μmol/L)的频数分布血铅含量 0.00~ 0.24~ 0.48~ 0.72~ 0.96~ 1.20~ 1.44~ 1.68~
组中值 0.12 0.36 0.60 0.84 1.08 1.32 1.56 1.80频 数 7 49 45 32 28 13 14 410累积频数 7 56 101 133 161 174 188 192累积频率 3.5 28.0 50.5 66.5 80.5 87.0 94.0 96.01.92~ 2.16~ 2.40~ 2.64~
2.04 2.28 2.52 2.764 1 2 1196 197 199 20098.0 98.5 99.5 100(2)因为正常人血铅含量越低越好,所以应计算单侧95%参考值范围。 百分位数法:第95%百分位数位于1.68~组段,组距为0.24,频数为4,该组段以前的累积频数为188,故P95?1.68?(200?0.95?188)?0.24?1.80(μmol/L)4即该地正常成人血铅值的95%参考值范围为小于1.80μmol/L。正态分布法:将组中值进行log变换,根据题中表格,得到均值和标准差计算表。某地200例正常成人血铅含量(μmol/L)均值和标准差计算表 血铅含量 0.00~
0.24~ 0.48~ 0.72~ 0.96~ 1.20~ 1.44~ 1.68~ 1.92~ 2.16~ 2.40~ 2.64~ 合计组中值 lg组中值(x) 0.12 0.36 0.60 0.84 1.08 1.32 1.56 1.80 2.04 2.28 2.52 2.76 ―-0.92 -0.44 -0.22 -0.08 0.03 0.12 0.19 0.26 0.31 0.36 0.40 0.44
―频 数(f) 7 49 45 32 28 13 14 4 4 1 21200fx -6.44 -21.56 -9.9 -2.56
0.44 -31.52fx2 5.4 2.178 0.2 0.4 0.4 0.0 0.8
计算均值和标准差:??31.52??0.11?0.2731
S?单侧95%参考值范围:?1.65S??0.?0.0lg?1(0.(?mol/L)即该地正常成人血铅值的95%参考值范围为小于1.96μmol/L,与百分位数法相比两者相差不大。(李 康)第四章
抽样误差与假设检验练习题一、单项选择题1. 样本均数的标准误越小说明A. 观察个体的变异越小
B. 观察个体的变异越大C. 抽样误差越大
D. 由样本均数估计总体均数的可靠性越小E. 由样本均数估计总体均数的可靠性越大2. 抽样误差产生的原因是A. 样本不是随机抽取
B. 测量不准确C. 资料不是正态分布
D. 个体差异E. 统计指标选择不当3. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为A. 正偏态分布
B. 负偏态分布C. 正态分布
D. t分布E. 标准正态分布124. 假设检验的目的是A. 检验参数估计的准确度
B. 检验样本统计量是否不同C. 检验样本统计量与总体参数是否不同
D. 检验总体参数是否不同E. 检验样本的P值是否为小概率5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~9.1×109/L,其含义是A. 估计总体中有95%的观察值在此范围内B. 总体均数在该区间的概率为95%C. 样本中有95%的观察值在此范围内D. 该区间包含样本均数的可能性为95%E. 该区间包含总体均数的可能性为95%答案:E D C D E二、计算与分析1. 为了解某地区小学生血红蛋白含量的平均水平,现随机抽取该地小学生450人,算得其血红蛋白平均数为101.4g/L,标准差为1.5g/L,试计算该地小学生血红蛋白平均数的95%可信区间。[参考答案]样本含量为450,属于大样本,可采用正态近似的方法计算可信区间。 X?101.4,S?1.5,n?
450,S???0.07 95%可信区间为下限:X-u?/2.S?101.4?1.96?0.07?101.26(g/L) 上限:X?u?/2.S?101.4?1.96?0.07?101.54(g/L)即该地成年男子红细胞总体均数的95%可信区间为101.26g/L~101.54g/L。2. 研究高胆固醇是否有家庭聚集性,已知正常儿童的总胆固醇平均水平是175mg/dl,现测得100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平为 13207.5mg/dl,标准差为30mg/dl。问题:①如何衡量这100名儿童总胆固醇样本平均数的抽样误差?②估计100名儿童的胆固醇平均水平的95%可信区间;③根据可信区间判断高胆固醇是否有家庭聚集性,并说明理由。[参考答案]① 均数的标准误可以用来衡量样本均数的抽样误差大小,即S?30mg/dl,n?
100SX???3.0 ② 样本含量为100,属于大样本,可采用正态近似的方法计算可信区间。X?207.5,S?30,n?100,SX?3,则95%可信区间为下限:X-u?/2.S?207.5?1.96?3?201.62(mg/dl) 上限:X?u?/2.S?207.5?1.96?3?213.38(mg/dl)故该地100名儿童的胆固醇平均水平的95%可信区间为201.62mg/dl~213.38mg/dl。③因为100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平的95%可信区间的下限高于正常儿童的总胆固醇平均水平175mg/dl,提示患心脏病且胆固醇高的父辈,其子代胆固醇水平较高,即高胆固醇具有一定的家庭聚集性。(李 康)第五章 t检验练 习 题一、单项选择题1. 两样本均数比较,检验结果P?0.05说明A. 两总体均数的差别较小
B. 两总体均数的差别较大C. 支持两总体无差别的结论
D. 不支持两总体有差别的结论
E. 可以确认两总体无差别142. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指A. 两样本均数的差别具有实际意义B. 两总体均数的差别具有实际意义C. 两样本和两总体均数的差别都具有实际意义D. 有理由认为两样本均数有差别E. 有理由认为两总体均数有差别3. 两样本均数比较,差别具有统计学意义时,P值越小说明A. 两样本均数差别越大
B. 两总体均数差别越大C. 越有理由认为两样本均数不同
D. 越有理由认为两总体均数不同E. 越有理由认为两样本均数相同4. 减少假设检验的Ⅱ类误差,应该使用的方法是A. 减少Ⅰ类错误
B. 减少测量的系统误差C. 减少测量的随机误差
D. 提高检验界值E. 增加样本含量5.两样本均数比较的t检验和u检验的主要差别是A. t检验只能用于小样本资料
B. u检验要求大样本资料C. t检验要求数据方差相同
D. t检验的检验效能更高E. u检验能用于两大样本均数比较答案:D E D E B二、计算与分析1. 已知正常成年男子血红蛋白均值为140g/L,今随机调查某厂成年男子60人,测其血红蛋白均值为125g/L,标准差15g/L。问该厂成年男子血红蛋白均值与一般成年男子是否不同?[参考答案]因样本含量n&50(n=60),故采用样本均数与总体均数比较的u检验。(1)建立检验假设, 确定检验水平H0:???0,该厂成年男子血红蛋白均值与一般成年男子相同15H1:???1,该厂成年男子血红蛋白均值与一般成年男子不同??0.05(2) 计算检验统计量
u?X???140?125==7.75 1560?X(3) 确定P值,做出推断结论7.75&1.96,故P&0.05,按α=0.05水准,拒绝H0,接受H1,可以认为该厂成年男子血红蛋白均值与一般成年男子不同,该厂成年男子血红蛋白均值低于一般成年男子。2. 某研究者为比较耳垂血和手指血的白细胞数,调查12名成年人,同时采取耳垂血和手指血见下表,试比较两者的白细胞数有无不同。表
成人耳垂血和手指血白细胞数(10g/L) 编号 12 3 4 5 6 7 8 9 10 1112耳垂血 9.7 6.2 7.0 5.3 8.1 9.9 4.7 5.8 7.8 8.6 6.19.9手指血 6.7 5.4 5.7 5.0 7.5 8.3 4.6 4.2 7.5 7.0 5.310.3
[参考答案]本题为配对设计资料,采用配对t检验进行分析 (1)建立检验假设, 确定检验水平H0:?d=0,成人耳垂血和手指血白细胞数差异为零16H1:?d?0,成人耳垂血和手指血白细胞数差异不为零 ??0.05(2) 计算检验统计量?d?11.6,?d2?20.36d??dn?11.?0.967 Sd
?t??d2?d?n?122?11.6?20.36??12?1?0.912 d??dd?0d0.967????3.672 =t?SdSdSdn0.912t=3.672&t0.05/2,11,P & 0.05,拒绝H0,接受H1,差别有统计学意义,可以认为两者的白细胞数不同。3. 分别测得15名健康人和13名Ⅲ度肺气肿病人痰中?1抗胰蛋白酶含量(g/L)如下表,问健康人与Ⅲ度肺气肿病人?1抗胰蛋白酶含量是否不同?表
健康人与Ⅲ度肺气肿患者α1抗胰蛋白酶含量(g/L)健康人
Ⅲ度肺气肿患者2.7
17[参考答案]X2?4.323,S2?1.107
由题意得,X1?2.067,S1?1.015;本题是两个小样本均数比较,可用成组设计t检验,首先检验两总体方差是否相等。H0:?12=?22,即两总体方差相等H1:?12≠?22,即两总体方差不等?=0.052S21.1072F =2==1.19 S11.0152F0.05?12,14?=2.53&1.19,F&F0.05?12,14?,故P&0.05,按α=0.05水准,不拒绝H0,差别无统计学意义。故认为健康人与Ⅲ度肺气肿病人α1抗胰蛋白酶含量总体方差相等,可直接用两独立样本均数比较的t检验。(1)建立检验假设, 确定检验水平H0:?1??2,健康人与Ⅲ度肺气肿病人?1抗胰蛋白酶含量相同H1:?1??2,健康人与Ⅲ度肺气肿病人?1抗胰蛋白酶含量不同??0.05(2) 计算检验统计量Sc2(n?1)S1?(n2?1)S2?1=1.12 n1?n2?222t?(1?2)?0|1?2|?S1?2S1?2=5.63(3) 确定P值,做出推断结论t=5.63& t0.001/2,26,P & 0.001,拒绝H0,接受H1,差别有统计学意义,可认为健康人与Ⅲ度肺气肿病人α1抗胰蛋白酶含量不同。4.某地对241例正常成年男性面部上颌间隙进行了测定,得其结果如下表,问不同身高正常男性其上颌间隙是否不同?18表
某地241名正常男性上颌间隙(cm)身高 (cm)161~172~ 例数 116 125 均数 0.0 标准差 0.1
[参考答案]本题属于大样本均数比较,采用两独立样本均数比较的u检验。由上表可知,n1=116 , X1=0.2189 ,
S1=0.2351n2=125 , X2=0.2280 ,
S2=0.2561(1)建立检验假设, 确定检验水平H0:?1??2,不同身高正常男性其上颌间隙均值相同H1:?1??2,不同身高正常男性其上颌间隙均值不同??0.05(2) 计算检验统计量
u?1?2?S1?2=0.91(3) 确定P值,做出推断结论u=0.91&1.96,故P&0.05,按α=0.05水准,不拒绝H0, 差别无统计学意义,尚不能认为不同身高正常男性其上颌间隙不同。5.将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验,测得稀释倍数如下表,问两组的平均效价有无差别?表
钩端螺旋体病患者凝溶试验的稀释倍数标准株 100 200 400 400 400 400 800 00 00 水生株 100 100 100 200 200 200 200 400 400 800 1600
[参考答案]本题采用两独立样本几何均数比较的t检验。t=2.689&t0.05/2,22,P&0.05,拒绝H0,接受H1,差别有统计学意义,可认为两组的平均效价有差别。6.为比较男、女大学生的血清谷胱甘肽过氧化物酶(GSH-Px)的活力是否相同,某医生对某大学18~22岁大学生随机抽查男生48名,女生46名,测定其血清谷胱甘肽过氧化酶含量(活力单位),男、女性的均数分别为96.53和93.73,男、女性标准差分别为7.66和14.97。问男女性的GSH-Px是否相同?[参考答案]由题意得 n1=48, X1?96.53, S1=7.66n2=46, X2=93.73, S2=14.97本题是两个小样本均数比较,可用成组设计t检验或t’检验,首先检验两总体方差是否相等。H0:?12=?22,即两总体方差相等H1:?12≠?22,即两总体方差不等?=0.052S27.662F =2==3.82 2S114.97F =3.82&F0.05?47,45?,故P&0.05,差别有统计学意义,按?=0.05水准,拒绝H0,接受H1,故认为男、女大学生的血清谷胱甘肽过氧化物酶的活力总体方差不等,不能直接用两独立样本均数比较的t检验,而应用两独立样本均数比较的t’检验。t'?X1?X2S1S?2n1n222=1.53, t’0.05/2=2.009,t’&t’0.05/2,P&0.05,按α=0.05水准,不拒绝H0, 差别无统计学意义,尚不能认为男性与女性的GSH-Px有差别。
20(沈其君, 施榕)第六章
方差分析练 习 题一、单项选择题1. 方差分析的基本思想和要点是A.组间均方大于组内均方
B.组内均方大于组间均方C.不同来源的方差必须相等
D.两方差之比服从F分布 E.总变异及其自由度可按不同来源分解2. 方差分析的应用条件之一是方差齐性,它是指A. 各比较组相应的样本方差相等
B. 各比较组相应的总体方差相等C. 组内方差=组间方差
D. 总方差=各组方差之和
E. 总方差=组内方差 + 组间方差3. 完全随机设计方差分析中的组间均方反映的是A. 随机测量误差大小
B. 某因素效应大小C. 处理因素效应与随机误差综合结果
D. 全部数据的离散度 E. 各组方差的平均水平4. 对于两组资料的比较,方差分析与t检验的关系是A. t检验结果更准确
B. 方差分析结果更准确C. t检验对数据的要求更为严格
D. 近似等价E. 完全等价5.多组均数比较的方差分析,如果P?0.05,则应该进一步做的是A.两均数的t检验
B.区组方差分析C.方差齐性检验
D.q检验E.确定单独效应答案:E B C E D21二、计算与分析1.在评价某药物耐受性及安全性的I期临床试验中,对符合纳入标准的40名健康自愿者随机分为4组,每组10名,各组注射剂量分别为0.5U、1U、2U、3U,观察48小时后部分凝血活酶时间(s)。试比较任意两两剂量间的部分凝血活酶时间有无差别?各剂量组48小时部分凝血活酶时间(s)0.5 U 36.8 34.4 34.3 35.7 33.2 31.1 34.3 29.8 35.4 31.21 U 40.0 35.5 36.7 39.3 40.1 36.8 33.4 38.3 38.4 39.82 U 32.9 37.9 30.5 31.1 34.7 37.6 40.2 38.1 32.4 35.63 U 33.0 30.7 35.3 32.3 37.4 39.1 33.5 36.6 32.0 33.8
[参考答案]如方差齐同,则采用完全随机设计的方差分析。2经Bartlett 方差齐性检验,?2=1.8991 ,?=3。由于?0.05,3=7.81,?2??02.05,3 ,故P&0.05,可认为四组48小时部分凝血活酶时间的总体方差齐同,于是采用完全随机设计的方差分析对四个剂量组部分凝血活酶时间进行比较。(1)提出检验假设,确定检验水准H0:?1??2??3??4,即四个剂量组部分凝血活酶时间的总体均数相同H1:?1、?2、?3、?4不全相同,即四个剂量组部分凝血活酶时间的总体均数不全相同?=0.05(2)计算检验统计量,列于方差分析表中22方差分析表变异来源 处理组间 组内(误差) 总变异
(3)确定P值,做出推断结论分子自由度?TR?3,分母自由度?E?36,查F界表(方差分析用),F0.05(3 ,36)=2.87。由于F=4.80,F?F0.05(3 ,36),故P&0.05,按照?= 0.05的显著性水准,拒绝H0,接受H1,差别有统计学意义,可认为四个剂量组部分凝血活酶时间的总体均数不全相同,进而需进行均数间多重比较。本题采用SNK法进行多重比较。 (1)提出检验假设,确定检验水准H0:?A??B,即任意两组部分凝血活酶时间的总体均数相同
H1:?A??B,即任意两组部分凝血活酶时间的总体均数不相同
?=0.05(2)计算检验统计量,用标记字母法标记多重比较结果(?=0.05)组别 1 U2 U 3 U 0.5 U(3)做出推断结论1U与 0.5U,1U与 2U ,1U与3U间差别有统计学意义(标记字母不同),可认为1U与 0.5U,1U与 2U ,1U与3U间部分凝血活酶时间的总体均数不同。0.5 U、2U、3U组彼此间差别无统计学意义(均含有字母B),可认为这三组
23平方和SS 101.0 353.5640自由度?3
39均方MS 33.3
F值 4.80均数 37.83035.100 34.370 33.620例数 10 10 10 10SNK标记 A B B B部分凝血活酶时间的总体均数相同。2.为探讨小剂量地塞米松对急性肺损伤动物模型肺脏的保护作用,将36只二级SD大鼠按性别、体重配成12个配伍组,每一配伍组的3只大鼠被随机分配到对照组、损伤组与激素组,实验24小时后测量支气管肺泡灌洗液总蛋白水平(g/L),结果如下表。问3组大鼠的总蛋白水平是否相同?3组大鼠总蛋白水平(g/L)配伍组 1 2 3 4 5 6 7 8 9 10 11 12
[参考答案]本题采用随机区组设计的方差分析。 (1)提出检验假设,确定检验水准H0(A):?1??2??3,即三组大鼠总蛋白水平的总体均值相同对照组 0.36 0.28 0.26 0.25 0.36 0.31 0.33 0.28 0.35 0.41 0.49 0.27损伤组 1.48 1.42 1.33 1.48 1.26 1.53 1.40 1.30 1.58 1.24 1.47 1.32激素组 0.30 0.32 0.29 0.16 0.35 0.43 0.31 0.13 0.33 0.32 0.26 0.26H1(A):?1、?2、?3不全相同,即三组大鼠总蛋白水平的总体均值不全相同 H0(B):?1??2????12,即不同配伍组大鼠总蛋白水平的总体均值相同 H1(B):?1、?2、?、?12 不全相同,即不同配伍组大鼠总蛋白水平的总体均值不全相同?=0.05(2)计算检验统计量,列于方差分析表中方差分析表24变异来源 处理组间 区组间 误差 总变异平方和SS 9.8 0.9自由度?2 11 22 35均方MS4.3 0.0066F值 719.80
(3)确定P值,做出推断结论。对于处理因素,分子自由度?A=2,分母自由度?E=22,查F界值表(方差分析用),F0.05(2,22)=3.44。由于F=719.80,F?F0.05(2,22),故P&0.05,按照?= 0.05的显著性水准,拒绝H0(A),差别有统计学意义,可认为三组大鼠总蛋白水平的总体均值不全相同。对于区组因素,分子自由度?B=11,分母自由度?E=22,查F界值表(方差分析用),F0.05(11,22)=2.26。由于F=1.56,F?F0.05(11,22),故P&0.05,照?= 0.05的显著性水准,不拒绝H0(B),差别无统计学意义,尚不能认为区组因素对大鼠总蛋白水平有影响。3.为研究喹啉酸对大鼠急性和亚急性炎症的影响,将40只体重为200?20(g)的雄性Wistar大鼠建立急性和亚急性炎症动物模型,然后随机分为4组,每组10只,给予不同的处理,观察其WBC值。4种处理分别为:腹腔注射生理盐水后3小时处死、腹腔注射生理盐水后6小时处死、腹腔注射喹啉酸(0.35mg/g)后3小时处死,腹腔注射喹啉酸(0.35mg/g)后6小时处死。实验结果如下表。问喹啉酸与给药距处死的时间间隔(简称时间)对WBC值是否有影响?不同药物与不同时间大鼠WBC值(103)时
物生理盐水 21.321.9 11.125喹啉酸 15.8
9.411.0 12.8 12.53h
18.8 13.5 22.6
23.0 22.8 17.8 24.6 25.35.3
13.9 15.8 18.3 13.0 14.09.3 11.0
19.0 15.3 19.2 18.2 17.319.0 25.2 22.9 19.8 22.76h
[参考答案]本题采用2?2析因设计方差分析。 (1)提出检验假设,确定检验水准H0(A):?1??2,即A因素两个水平组WBC值总体均数相等H1(A):?1??2,即A因素两个水平组WBC值总体均数不相等 H0(B):?1??2,即B因素两个水平组WBC值总体均数相等H1(B):?1??2,即B因素两个水平组WBC值总体均数不相等H0(AB):A与B无交互效应
H1(AB):A与B存在交互效应?=0.052.计算检验统计量,列于方差分析表中。方差分析表变异来源 A因素 B因素 A?B 误差 总变异3.确定P值,做出推断结论。
26平方和SS 423.3
3.0 自由度?
1 36 39均方MS 423.3
F值 48.68 33.48
0.41对于A因素,?A=1,?E=36,查F界值表(方差分析用),F0.05(1,36)=4.11。由于FA=48.68,FA?F0.05(1,36),故P& 0.05,按照?= 0.05的显著性水准,拒绝H0(A),接受H1(A),认为A因素(药物)两个水平组WBC值总体均数不相等。对于B因素,?B=1,?E=36,查F界值表(方差分析用),F0.05(1,36)=4.11。由于FB=33.48,FB?F0.05(1,36),故P& 0.05,按照?= 0.05的显著性水准,拒绝H0(B),认为B因素(时间)两个水平组WBC值总体均数不相等。对于AB交互作用,?AB=1,?E=36,查F界值表(方差分析用),F0.05(1,36)=4.11。由于FAB=0.41,FAB?F0.05(1,36),故P&0.05,按照?= 0.05的显著性水准,不拒绝H0(AB),认为A(药物)与B(时间)间无交互效应。
(钟晓妮)第七章
相对数及其应用练习题一、单项选择题1. 如果一种新的治疗方法能够使不能治愈的疾病得到缓解并延长生命,则应发生的情况是A. 该病患病率增加
B. 该病患病率减少C. 该病的发病率增加
D. 该病的发病率减少 E. 该疾病的死因构成比增加2. 计算乙肝疫苗接种后血清学检查的阳转率,分母为A. 乙肝易感人数
B. 平均人口数C. 乙肝疫苗接种人数
D. 乙肝患者人数 E. 乙肝疫苗接种后的阳转人数273. 计算标准化死亡率的目的是A. 减少死亡率估计的偏倚
B. 减少死亡率估计的抽样误差C. 便于进行不同地区死亡率的比较
D. 消除各地区内部构成不同的影响 E. 便于进行不同时间死亡率的比较4. 影响总体率估计的抽样误差大小的因素是A. 总体率估计的容许误差
B. 样本率估计的容许误差C. 检验水准和样本含量
D. 检验的把握度和样本含量 E. 总体率和样本含量5. 研究某种新药的降压效果,对100人进行试验,其显效率的95%可信区间为0.862~0.926,表示A. 样本显效率在0.862~0.926之间的概率是95%B. 有95%的把握说总体显效率在此范围内波动C. 有95%的患者显效率在此范围D. 样本率估计的抽样误差有95%的可能在此范围E. 该区间包括总体显效率的可能性为95%答案:A C D E E二、计算与分析1. 某工厂在“职工健康状况报告中”写到:“在946名工人中,患慢性病的有274人,其中女性 219人,占80%,男性55人,占20%。所以女性易患慢性病”,你认为是否正确?为什么?[参考答案]不正确,因为此百分比是构成比,不是率,要知道男女谁更易患病需知道946名工人中的男女比例,然后计算男女患病率。2. 在“锑剂短程疗法治疗血吸虫病病例的临床分析”一文中,根据下表资料认为“其中10~岁组死亡率最高,其次为20~岁组”,问这种说法是否正确?
锑剂治疗血吸虫不同性别死亡者年龄分布年龄组0~ 男
62810~ 20~ 30~ 40~ 50~ 合计[参考答案]11
5 297 6 3 2 1 2218 10
6 51不正确,此为构成比替代率来下结论,正确的计算是用各年龄段的死亡人数除各年龄段的调查人数得到死亡率。3. 某研究根据以下资料说明沙眼20岁患病率最高,年龄大的反而患病率下降,你同意吗?说明理由。某研究资料沙眼病人的年龄分布年龄组 0~ 10~ 20~ 30~40~ 50~ 60~
70~ 合计[参考答案]不正确,此为构成比替代率来下结论,正确的计算是用各年龄段的沙眼人数除各年龄段的调查人数得到患病率。4. 今有两个煤矿的工人尘肺患病率(%)如下表,试比较两个煤矿的工人尘肺总的患病率。两个煤矿的工人尘肺患病率情况(%)沙眼人数
47 198 330198 128
81027构成比(%)
4.6 19.3 32.1 19.3 12.4
0.8 100.029工龄 (年)
矿 检查人数 14026尘肺人数 患病率 120 168 316 6040.86 3.92 12.43 2.90乙
矿检查人数 尘肺人数 患病率992 2 8 117 1270.20 0.42 11.54 3.256~
[参考答案]3911两个煤矿的工人尘肺标准化患病率(%)工龄标准构成(年)
10~ 合计814?100%?3.29% 乙矿尘肺患病率??100%?1.88%24764甲
原患病率 预期患病人数 0.86 3.92 12.43
129 243 442 814
矿原患病率 预期患病人数 0.20 0.42 11.54
30 26 410 466甲矿尘肺患病率=甲矿尘肺患病率高于乙矿尘肺患病率。5. 抽样调查了某校10岁儿童200名的牙齿,患龋130人,试求该校儿童患龋率的95%的区间估计。 [参考答案]P?130?100%?65% 200P1?P?n0.65?0.35?0.%200Sp?(P-u0.05Sp,P+u0.05Sp)=65%?1.96?3.37%,65%?1.96?3.37%30=(58.39%,71.61%)(刘启贵)第八章
?2检验练 习 题一、单项选择题1. 利用?2检验公式不适合解决的实际问题是A. 比较两种药物的有效率
B. 检验某种疾病与基因多态性的关系C. 两组有序试验结果的药物疗效
D. 药物三种不同剂量显效率有无差别 E. 两组病情“轻、中、重”的构成比例2.欲比较两组阳性反应率, 在样本量非常小的情况下(如n1?10,n2?10), 应采用A. 四格表?2检验
B. 校正四格表?2检验C. Fisher确切概率法
D. 配对?2检验E. 校正配对?2检验23.进行四组样本率比较的?2检验,如?2??0.01,3,可认为A. 四组样本率均不相同
B. 四组总体率均不相同C. 四组样本率相差较大
D. 至少有两组样本率不相同 E. 至少有两组总体率不相同24. 从甲、乙两文中,查到同类研究的两个率比较的?2检验,甲文?2??0.01,1,2乙文?2??0.05,1,可认为A. 两文结果有矛盾
B. 两文结果完全相同C. 甲文结果更为可信
D. 乙文结果更为可信E. 甲文说明总体的差异较大5. 两组有效率比较检验功效的相关因素是31A. 检验水准和样本率
B. 总体率差别和样本含量C. 样本含量和样本率
D. 总体率差别和理论频数E. 容许误差和检验水准答案:C C E C B二、计算与分析1.某神经内科医师观察291例脑梗塞病人,其中102例病人用西医疗法,其它189 例病人采用西医疗法加中医疗法,观察一年后,单纯用西医疗法组的病人死亡13例,采用中西医疗法组的病人死亡9例,请分析两组病人的死亡率差异是否有统计学意义?[参考答案]本题是两组频数分布的比较,资料课整理成下表的形式。两组疗法病人的死亡率的比较组别西医疗法西医疗法加中医疗法合计 死亡 13 9 22 存活 89 180 269 合计 102 189 291
(1)建立检验假设并确定检验水准H0:?1??2,即两组病人的死亡率相等H1:?1??2,即两组病人的死亡率不等??0.05(2)用四个表的专用公式,计算?2检验统计量?2值?13?180?89?9??291=6.041
(ad?bc)2n??=(a?b)(c?d)(a?c)(b?d)22?269?102?18922(3)确定P 值,作出推断结论以?=1查附表7的?2界值表,得P?0.05。按??0.05水准,拒绝H0,接受H1,可以认为两组病人的死亡率不等。2.某医院研究中药治疗急性心肌梗死的疗效,临床观察结果见下表。问接 32受两种不同疗法的患者病死率是否不同?两种药治疗急性心肌梗死的疗效
组别 中药组 非中药组 合计
[参考答案]
本题T22=5?14?0.853?1,宜用四格表的确切概率法 82存活 65 12 77死亡 3 2 5合计 68 14 82病死率(%) 4.41
14.29 6.10(1)建立检验假设并确定检验水准H0:?1??2,即两种不同疗法的患者病死率相同
H1:?1??2,即两种不同疗法的患者病死率不同
??0.05(2)计算确切概率(a+b)!(c+d)!(a+c)!(b+d)!=0.2001
P=i(3)作出推断结论按??0.05水准,不拒绝H0,无统计学意义,还不可以认为两种不同疗法的患者病死率不同。3.某医师观察三种降血脂药A,B,C的临床疗效,观察3个月后,按照患者的血脂下降程度分为有效与无效,结果如下表,问三种药物的降血脂效果是否不同?三种药物降血脂的疗效药物 A B C
[参考答案]
2527 22合计
145 87 62本题为3个样本构成比的比较,是3×2表资料。 (1) 建立检验假设并确定检验水准
H0:三种药物的降血脂有效的概率相同
H1:三种药物的降血脂有效的概率相同
?=0.05(2) 计算检验统计量A2??n(??1)nRnC2=294?2402222??????1?=9.93220???6274?62???3?1??2?1??23.确定P值,作出推断结论查?2界值表得P & 0.05 ,在?=0.05检验水准下,拒绝H0,接受H1,认为三种药物的降血脂有效率不同。4.某医师按照白血病患者的发病情况,将308例患者分为两组,并按ABO血型分类记数,试问两组患者血型总体构成有无差别?308例急、慢性白血病患者的血型分布组别 急性组 慢性组 合计[参考答案]本例为2个样本构成比的比较,是2×4表资料。 (1) 建立检验假设并确定检验水准
H0:两组患者血型总体构成比相同
H1:两组患者血型总体构成比不全相同
?=0.05A 60 42 102B 47 30 77O 61 34 95AB 21 13 34合计 189 119 30834(2)计算检验统计量A2??n(??1) nRnC2?602?472132??308???????1?102???0.6081
34?119?????2?1??4?1??3(3)确定P值,作出推断结论查?2界值表得P & 0.05 ,在?=0.05检验水准下,不拒绝H0,还不能认为两组患者血型总体构成比不全相同。5.为研究某补钙制剂的临床效果,观察56例儿童,其中一组给与这种新药,另一组给与钙片,观察结果如表,问两种药物预防儿童的佝偻病患病率是否不同?表
两组儿童的佝偻病患病情况组别新药组钙片组合计
[参考答案]本题是两组二分类频数分布的比较,用四个表?2检验。表中n=56&40,且有一个格子的理论频数小于5,须采用四个表?2检验的校正公式进行计算。(1)建立检验假设并确定检验水准H0:?1??2,即新药组与钙片组儿童佝偻病患病概率相同H1:?1??2,即新药组与钙片组儿童佝偻病患病概率不同 病例数 8 6 14 非病例数 32 10 42 合计 40 16 56 患病率(%) 20.0 37.5 25.0?=0.05(2)用四个表?2检验的校正公式,计算检验统计量?2值:3556??8?10?32?6????562(|ad-bc|-n/2)n2??1.050
?c2==?40?16?14?52(a+b)(c+d)(a+c)(b+d)2?=13. 确定P值,作出推断结论222以?=1查附表7的?2界值表得?0.25?1??1.32,?&?0.25?1?, P & 0.05。按??0.05水准,不拒绝H0,无统计学意义,还不能认为新药组与钙片组儿童佝偻病患病概率不同。6.某医院147例大肠杆菌标本分别在A,B两种培养基上培养,然后进行检验,资料见下表,试分析两种培养基的检验结果是否有显著性差别?
A、B两种培养基上培养大肠杆菌标本结果A培养基+ - 合
计B培养基 + 59 15 74- 36 37 73合
计 95 52 147
[参考答案]本题是一个配对设计的二分类资料,采用配对四个表资料的?2检验。(1)建立检验假设并确定检验水准H0:B?C,即两种培养基的阳性培养率相等H1:B?C,即两种培养基的阳性培养率不相等??0.05(2)计算检验统计量本例b+c =36+15=51& 40 ,用配对四个表?2检验公式,计算检验统计量?2值(b?c)2?36?15????8.65, ??1 =36?15b?c223. 确定P值,作出推断结论36查?2界值表得P & 0.05。按??0.05水准,拒绝H0。认为两种培养基的阳性培养率不同。
(王乐三)第九章
非参数检验练 习 题一、 单项选择题1.对医学计量资料成组比较, 相对参数检验来说,非参数秩和检验的优点是A. 适用范围广
B. 检验效能高C.检验结果更准确
D. 充分利用资料信息E. 不易出现假阴性错误2. 对于计量资料的比较,在满足参数法条件下用非参方法分析,可能产生的结果是A. 增加Ⅰ类错误
B. 增加Ⅱ类错误C. 减少Ⅰ类错误
D. 减少Ⅱ类错误E. 两类错误都增加3. 两样本比较的秩和检验,如果样本含量一定,两组秩和的差别越大说明A. 两总体的差别越大
B. 两总体的差别越小C. 两样本的差别可能越大
D. 越有理由说明两总体有差别 E. 越有理由说明两总体无差别4. 多个计量资料的比较,当分布类型不清时,应选择的统计方法是A. 方差分析
B. Wilcoxon T检验C. Kruskal-Wallis H检验
D. u检验E. ?2检验5.在一项临床试验研究中,疗效分为“痊愈、显效、有效、无 37效”四个等级,现欲比较试验组与对照组治疗效果有无差别,宜采用的统计方法是A. Wilcoxon秩和检验
B. 2?4列联表?2检验
C. 四格表?2检验
D. Fisher确切概率法
E. 计算标准化率答案:A B D C A 二、计算与分析1.某医院测定10名受试者针刺膻中穴前后痛阈的数据,见下表,试分析针刺膻中穴前后痛阈值的差异有无统计学意义?10名受试者针刺膻中穴前后痛阈资料编号 1 2 3 4 5 6 7 8 9 10
[参考答案](1)建立假设检验针刺前 600 600 685 5 0 1500针刺后
800 1400H0:差值总体中位数为零 H1:差值总体中位数不为零 α=0.05(2)计算统计量见下表3810名受试者针刺膻中穴前后痛阈 编号 1 2 3 4 5 6 7 8 9 10 合计针刺前 600 600 685 5 0 1500针刺后 610 700 575 600 600 5 800 1400差值 10 100 -110 -450 -300 300 -50 75 -200 -100秩次 1 4.5 -6 -10 -8.5 8.5 -2 3 -7 -4.5
T++T- = 17+38 = 55,总秩和n(n+1)=210(10+1)=55, 2计算准确无误T = min(T+,T-)=17。 (3)查表及结论现n=10,查T界值表T0.05(10)=8~47,T=17落在此范围内,所以P ? 0.05,按α=0.05水准,不拒绝H0,针刺膻中穴前后痛阈值的差异无统计学意义。2. 8名健康男子服用肠溶醋酸棉酚片前后的精液中精子浓度检查结果如下表(服用时间3月),问服用肠溶醋酸棉酚片前后精液中精子浓度有无下降?8名健康男子服用肠溶醋酸棉酚片前后的精液中精子浓度(万/ml) 编号 1 2 3 4 5 6 7
2600039服药后
660 00 008[参考答案](1)建立假设检验H0:差值总体中位数为零 H1:差值总体中位数不为零
??0.05(2)计算统计量见下表8名健康男子服用肠溶醋酸棉酚片前后的精液中精子浓度(万/ml) 编号 1 2 3 4 5 6 7 8 合计服药前
5800服药后 660 00 00 2200差值 - - - -3600秩次 -6 -7 -3 2 1 -5 -8 -4T+=3
T-=33n(n?1)8?(8?1)??36, 22T++T- = 33+3 = 36,总秩和计算准确无误T = min(T+,T-)= 3。 (3)查表及结论现n=8,查T界值表T0.05(8)=3~33,T=3恰好落在界点上,所以P ≤0.05,按α=0.05水准,拒绝H0,接受H1,可认为健康男子服用肠溶醋酸棉酚片前后的精液中精子浓度有差异。3. 雌鼠两组分别给以高蛋白和低蛋白的饲料,实验时间自生后28天至84天止,计8周。观察各鼠所增体重,结果如下表,问两种饲料对雌鼠体重增加有无显著影响?两种饲料雌鼠体重增加量(g)高蛋白组
40低蛋白组83
97 104 107 113 119 123 124 129 134 146 161[参考答案](1)建立假设检验65 70 70 78 85 94 101 107 122H0:两总体分布相同 H1:两总体分布不同 α=0.05 (2)计算统计量将两样本21个数据由小到大统一编秩,见下表两种饲料雌鼠体重增加量(g)高蛋白组 83 97 104 107 113 119 123 124 129 134 146
秩次 5 8 10 11.5 13 14 16 17 18 19 20低蛋白组 65 70 70 78 85 94 101 107 12241秩次 1 2.5 2.5 4 6 7 9 11.5 1516121 172.5(T1)
58.5(T2)T= 58.5(3)查表与结论n1?9,n2?12,n2?n1=3,按α=0.05,查T值表得范围71~127, 因为T=58.5&71,超出范围,故P&0.05,拒绝H0,接受H1,接受即两种饲料对雌鼠体重增加有显著影响。4.测得铅作业与非铅作业工人的血铅值(μg/100g),问铅作业工人的血铅值是否高于非铅作业工人?铅作业与非铅作业工人的血铅值(μg/100g) 非铅作业组5
21[参考答案](1)建立假设检验铅作业组 17
44H0:两总体分布相同 H1:两总体分布不同??0.05(2)计算统计量将两样本17个数据由小到大统一编秩,见下表铅作业与非铅作业工人的血铅值(μg/100g)非铅作业组
秩次42铅作业组 秩次5 5 6 7 9 12 13 15 18 211.5 1.5 3 4 5 6 7 8 10.5 13 59.5(T1)17 18 20 25 34 43 44
9 10.5 12 14 15 16 17
93.5(T2)T= 93.5 (3)查表与结论按α=0.05,查T值表得范围42~84, 因为T =93.5,n1?7,n2?10,n2?n1=3,超出范围,故P&0.05,拒绝H0,接受H1,铅作业工人的血铅值高于非铅作业工人的血铅值。5. 用VK3眼药水对近视眼患者作治疗,对照组用生理盐水作安慰剂,对两组的疗效进行观察,结果如下表,试分析VK3眼药水对近视眼患者的治疗是否有疗效?表
VK3眼药水治疗近视眼患者的疗效观察疗效 退步 不变 进步 恢复 合计
[参考答案](1)建立假设检验VK3眼药水组8 93 11
4 116生理盐水组20 60 10
1 91H0:两总体分布相同 H1:两总体分布不同 α=0.05
43(2)计算统计量将两样本的资料统一由小到大统一编秩,见下表:VK3眼药水治疗近视眼患者的疗效观察疗效 退步 不变 进步 恢复 合计
u?VK3眼药水组 生理盐水组 合计8 93 11 4 11620 60 10 1 9128 153 21 5 207范
围 1―28 29―181 182―202 203―207
平均秩次 盐水组秩和 14.5 105 192 205290 5 8715?1?1??0.5291??207?207??28?28?153?153?21?21?5?5??12??2.27由于u0.05/2 =1.96,u & u0.05/2, P & 0.05,拒绝H0,接受H1,有统计学意义,可认为两总体分布不同。即可认为VK3眼药水对近视眼患者的治疗有疗效。6.对正常、单纯性肥胖及皮质醇增多症三组人的血浆皮质醇含量进行测定,其结果见下表,问三组人的血浆皮质醇含量的差异有无统计学意义?
三组人的血浆皮质醇测定值(nmol/L)正常人 0.41.9 2.2 2.5 2.8 3.1
单纯性肥胖人0.6 1.2 2.0 2.4 3.1 4.144皮质醇增多症9.8 10.2 10.6 13.0 14.0 14.83.7 3.9 4.6 7.0[参考答案](1)建立假设检验5.0 5.9 7.4 13.6 15.6 15.6 21.6 24.0H0:三组人的血浆皮质醇含量的总体分布相同。 H1:三组人的血浆皮质醇含量的总体分布不全相同。??0.05(2)计算统计量将三样本30个观察值统一由小到大编秩,见下表:三组人的血浆皮质醇测定值(nmol/L)正常人 0.4 1.9 2.2 2.5 2.8 3.1 3.7 3.9 4.6 7 合计秩次 1 4 6 8 9 10.5 12 13 15 18 96.5单纯性肥胖人0.6 1.2 2 2.4 3.1 4.1 5 5.9 7.4 13.6 合计秩次 2 3 5 7 10.5 14 16 17 19 24 117.5皮质醇增多症9.8 10.2 10.6 13 14 14.8 15.6 15.6 21.6 24 合计秩次 20 21 22 23 25 26 27 28 29 30 251
Ti12H??3?N?1? ?NN?1ni?96.?12????
???3?30?1??18.12 010??2(3)查表及结论现k=3,ν=k-1=3-1=2查?2界值表?20.05,2=5.99,?2&?20.05,3;P&0.05按α=0.05水准,拒绝H0,接受H1,故可认为三组人的血浆皮质醇含量的总体分布
45有差别。7.在针刺麻醉下,对肺癌、肺化脓症及肺结核三组患者进行肺部手术,效果分四级,结果见下表,试比较针刺麻醉对三组病人的效果有无差异?三组患者肺部手术的针麻效果 针麻效果 Ⅰ Ⅱ Ⅲ Ⅳ 合计
[参考答案](1)建立假设检验肺癌
157H0:三组病人的总体效果相同。 H1:三组病人的总体效果不全相同。 α=0.05 (2)计算统计量将三个样本的资料统一由小到大编秩,见下表:表
三组患者肺部手术的针麻效果针麻例
数合计 范围 82 1―82 123 83―205平均 秩次 41.5 144
效果 肺癌 肺化脓症 肺结核 Ⅰ Ⅱ Ⅲ Ⅳ10 17 19 424 41 33 7 1052肺癌 肺化脓症 肺结核 415 2448996 590482 242448 65 36 8 15788 206―293 249.5 3.5 19 294―312 303 312
12122121合计 50 54.5 22758Ti12H??n?3?N?1? NN?1i?815.2758212??????
46????3?312?1??5.77 ?Hc=5.77=6.43 +123-123+88-88+19-191-(3)查表及结论现k=3,ν=k-1=3-1=2查?2界值表?20.05,2=5.99,?2&?20.05,3;P&0.05按α=0.05水准,拒绝H0,接受H1,故可认为三组病人的总体效果不全相同。
(刘启贵)第十章
线性相关与回归练 习 题一、单项选择题1. 回归系数的最小二乘估计使其平方和最小的是A. 各点到X均数直线的横向距离
B. 各点到X轴的横向距离C. 各点到回归直线的垂直距离
D. 各点到Y均数直线的垂直距离 E. 各点到Y轴的垂直距离2. 两数值变量相关关系越强,表示A. 相关系数越大
B. 相关系数的绝对值越大B. 回归系数越大
C. 回归系数的绝对值越大 E. 相关系数检验统计量的t值越大3. 回归分析的决定系数R2越接近于1,说明A. 相关系数越大
B. 回归方程的显著程度越高C. 应变量的变异越大
D. 应变量的变异越小 E. 自变量对应变量的影响越大4. 两组资料作回归分析,直线回归系数b较大的一组,表示A.两变量关系密切的可能性较大
B.检验显著的可能性较大C.决定系数R2较大
D.决定系数R2可能大也可能小
E.数量依存关系更密切??14?4X,5.
1―7岁儿童可以用年龄(岁)估计体重(市斤),回归方程为Y47若将体重换成国际单位kg,则此方程A.常数项改变
B.回归系数改变C.常数项和回归系数都改变
D.常数项和回归系数都不改变E.决定系数改变答案:D B E D C二、计算与分析1. 12名20岁女青年的身高与体重资料如下表,试问女青年身高与体重之间有无相关关系?表
12名20岁女青年的身高与体重资料编号 1 2 3 4 5 6 7 8 9 10 11 12 身高(cm) 164 156 172 172 177 180 166 162 172 167 158 152 体重(kg) 55
[参考答案]身高为X,体重为Y。56 60 68 66 65 56 55 60 55 46 51 n?12,?X?1998,?X2?333470,?Y?693,?Y2?40469,?XY?115885代入公式(10-2)得:lXX??XlYY??Y22??X??n470??803 12??Y??n??448.25 12lXY??XY???X???Y?885??500.5 n12由公式(10-1)计算相关系数
48下面采用t检验法对相关系数进行检验。(1) 建立检验假设H0:??0,即身高与体重之间不存在相关关系H1:??0, 即身高与体重之间存在相关关系??0.05(2) 计算统计量
t??4.7799??12?2?10(3) 查界值表,得统计结论查t界值表,得t0.005/2,10?3.581,t?t0.005/2,10,P?0.005,按??0.05水准,拒绝H0,接受H1,可以认为女青年身高与体重之间存在正相关关系。2. 某医师研究某种代乳粉价值时,用大白鼠做实验,得大白鼠进食量和体重增加量的资料如下,试问大白鼠的进食量与体重的增加量之间有无关系?能否用大白鼠的进食量来估计其体重的增加量?大白鼠进食量和体重增加量的资料动物编号 1 2 3 4 5 6 7 8 9 10 11 进食量(g) 820 780 720 867 690 787 934 679 639 820 780 增重量(g) 165 158 130 180 134 167 186 145 120 150 135
[参考答案]进食量为X,增重量为Y。n?11,?X?8516,?X2?6668876,?Y?1670,?Y2?258080,?XY?1309248由公式(10-2)计算可得:49lXX??XlYY??Y22??X??n.363 11??Y??n??lXY??XY???X???Y?0.364 n11由公式(10-1)计算相关系数:??.363?.881下面用r检验法对相关系数进行检验:由r=0.881,n=11,v=11-2=9查r界值表,得r0.005/2,9=0.776,因r&r0.005/2,9,故P&0.005, 按??0.05水准,拒绝H0,接受H1,可以认为大白鼠的进食量与体重增加量之间存在正相关关系。我们根据上表得数据绘制散点图,见下图,可以看出大白鼠的进食量与增重量有明显的直线趋势,我们考虑建立二者之间的线性回归方程。由上述计算lXX?,lXY?,lYY?,X?774.182,Y?151.818
代入公式(10-5)和(10-6)得:b?lXY??0.215 lXXa?Y?bX?151.818?0.215?774.182??15.003???15.003?0.215X 则回归方程为: Y
大白鼠的进食量与增重量之间关系散点图
最后我们采用方差分析法对回归方程作检验:(1) 建立假设检验:H0:??0;H1:??0,??0.05,(2) 由计算可得:SS总????Y?Y?n2?,SS回归lXY? lXX2SS剩余?SS总?SS回归?F?MS回归MS剩余?SS回归回归SS剩余剩余?31.192?回归?1,?剩余?11?2?9(3) 查界值表,得统计结论查F界值表,F0.01?1,P&0.01,拒绝H0, 接受H1,说明大9??10.56, F?F0.01?1,9?,白鼠的进食量与体重增加量之间存在线性回归关系,也就是说,可以用大白鼠的进食量来估计其体重的增加量。3. 测得347名13岁健康男童的身高和体重,身高均数为146.4cm,标准差为8.61cm,体重均数为37.04kg,标准差为6.67kg。身高和体重的相关系数r=0.74,试计算由身高推体重的回归系数及由体重推身高的回归系数。[参考答案]身高为X,体重为Y。由题意,X?146.4,SX?8.61;Y?37.04,SY?6.67,r?0.7451由身高推体重的回归系数为b1,则b1?rXX.lYYlXYrS0.74?6.67??Y??0.573 lXXlXXSX8.61由体重推身高的回归系数为b2,则b2?lXYrlXXlYYrS0.74?8.61?X?0.955 lYYlYYSY6.674. 某防治所作病因研究,对一些地区水质的平均碘含量(μg/l)与地方性甲状腺肿患病率进行了调查,结果如下表,试问甲状腺肿患病率与水质中碘的含量有无相关关系?局部地区水质的平均碘含量(μg/l)与地方性甲状腺肿患病率地区编号患病率(%) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 40.5 37.7 39.0 20.0 22.5 37.4 31.5 15.6 21.0 6.3 7.1 9.0 4.0 5.42.5 3.5 3.5 4.0 4.4 4.5 4.6 7.7 8.0 8.0 8.3 8.5 碘含量(μg/l) 1.0 2.0
[参考答案]甲状腺肿患病率为Y,水质中碘含量为X。① 将X,Y分别从小到大编秩,见下表(3)、(5)两栏;② 计算差数d,见(6)栏;③ 计算d2,见(7)栏,?d2?870;④代入公式(10-18)计算rsrs?1?6?870??0.912 21414?1
下面对rs进行检验(1)建立假设检验H0:?s?0;H1:?s?0,??0.05(2) 计算统计量rs=-0.912(3) 结论52当n?50时,查附表12中的等级相关系数rs界值表。由于rs0.05/2,14?0.538,rs?rs0.05/2,14,P?0.05,拒绝H0,接受H1,可认为甲状腺肿患病率与水质中碘的含量存在负相关关系。不同地区水质中碘含量(μg/L)与甲状腺肿患病率(%)地区编号 (1) 1 2 3 4 5 6 7 8 9 10 11 12 13 14水质中碘含量甲状腺肿患病率Y (4) 40.5 37.7 39.0 20.0 22.5 37.4 31.5 15.6 21.0 6.3 7.1 9.0 4.0 5.4秩次 (5) 14 12 13 7 9 11 10 6 8 3 4 5 1 2
d (6)-13 -10 -10 -2.5 -4.5 -5 -3 2 1 7 7.5 6.5 12 12d2 (7) 169 100 100 6.25 20.25 25 9 4 1 49 56.25 42.25 144 144X (2) 1.0 2.0 2.5 3.5 3.5 4.0 4.4 4.5 4.6 7.7 8.0 8.0 8.3 8.5秩次 (3) 1 2 3 4.5 4.5 6 7 8 9 10 11.5 11.5 13 14
(闫岩)第十一章
多元线性回归与多元逐步回归练 习 题一、单项选择题1. 在疾病发生危险因素的研究中,采用多变量回归分析的主要目的是A.节省样本
B.提高分析效率
C.克服共线影响
D.减少异常值的影响
E.减少混杂的影响
532. 多元线性回归分析中,反映回归平方和在应变量Y的总离均差平方和中所占比重的统计量是A. 简单相关系数
B .复相关系数C. 偏回归系数
D. 回归均方E. 决定系数R23. 对同一资料作多变量线性回归分析,若对两个具有不同个数自变量的回归方程进行比较,应选用的指标是A.决定系数
B. 相关系数C. 偏回归平方和
D. 校正决定系数E. 复相关系数4. 多元线性回归分析,对回归方程作方差分析,检验统计量F值反映的是A.所有自变量与应变量间是否存在线性回归关系B.部分自变量与应变量间是否存在线性回归关系C.自变量与应变量间存在的线性回归关系是否较强D.自变量之间是否存在共线E. 回归方程的拟合优度5. 在多元回归分析中,若对某个自变量的值都乘以一个常数c(c?0),则A. 偏回归系数不变、标准回归系数改变B. 偏回归系数改变、标准回归系数不变C.偏回归系数与标准回归系数均不改变D.偏回归系数与标准回归系数均改变E.偏回归系数和决定系数均改变答案:E E D A B二、计算与分析1.某种特殊营养缺乏状态下,儿童年龄(岁)、身高(cm)与体重(kg)测定结果见下表,?试建立年龄、身高与体重的二元回归方程;?对回归方程作检验;?计算复相关系数与决定系数;? 计算年龄和身高的标准偏回归系数。
营养缺乏儿童年龄、身高、体重测定值54编号i 身高X1 年龄X2 体重Y1 145 8 292 150 10 323 124 6 244 157 11 305 6 7 8 9 10 11 12129 127 140 122 107 107 155 148 8 7 10 9 10 6 12 9 25 26 35 26 25 23 35 31
[参考答案](1)参数估计模型 1??2.114+ 0.135X+0.923X 回归方程为:Y12变量 常数X1偏回归系数 标准误 标准化偏回归系数 2.114 0.135 0.9235.048 0.047 0.4340.564 0.419t 0.419 2.863 2.126P
0.685 0.019 0.062X2(2)方差分析变异来源 回归 误差 总变异从上表可见,F = 16.154, P & 0.001, 此回归方程有统计学意义。 (3)复相关系数R =0.884,决定系数R2 =0.782。?年龄和身高的标准偏回归系数第一个表。2.有学者认为,血清中低密度脂蛋白增高和高密度脂蛋白降低,是引起动脉硬化的一个重要原因。现测量了30名动脉硬化疑似患者的载脂蛋白AI、载脂蛋白B、载脂蛋白E、载脂蛋白C、低密度脂蛋白中的胆固醇、高密度脂蛋白中的胆固醇含量,资料如下表。
55离均差平方和 150.884 42.033 192.917自由度 2 9 11均方差 75.442 4.670F 16.154
P 0.001①分别作Y1和Y2对X1,X2,X3,X4的多元线性回归分析。②作Y2/Y1对X1,X2,X3,X4的逐步回归分析,并与前面的分析结果进行比较。30名动脉硬化疑似患者的观测资料序号载脂蛋白AI (mg/dL)载脂蛋白B 载脂蛋白E 载脂蛋白C (mg/dL)(mg/dL)(mg/dL)低密度脂蛋白 (mg/dL)高密度脂蛋白 (mg/dL)i1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30X1173 139 198 118 139 175 131 158 158 132 162 144 162 169 129 166 185 155 175 136 153 110 160 112 147 204 131 170 173 132X2106 132 112 138 94 160 154 141 137 151 110 113 137 129 138 148 118 121 111 110 133 149 86 123 110 122 102 127 123 131X37 6.4 6.9 7.1 8.6 12.1 11.2 9.7 7.4 7.5
6 10.1 7.2 8.5 6.3 11.5
13.8X414.7 17.8 16.7 15.7 13.6 20.3 21.5 29.6 18.2 17.2 15.9 42.8 20.7 16.7 10.1 33.4 17.5 20.4 27.2 26 16.9 24.7 10.8 16.6 18.4 21.0 13.4 24.7 19.0 29.2Y1137 162 134 188 138 215 171 148 197 113 145 81 185 157 197 156 156 154 144 90 215 184 118 127 137 126 130 135 188 122Y262 43 81 39 51 65 40 42 56 37 70 41 56 58 47 49 69 57 74 39 65 40 57 34 54 72 51 62 85 3856[参考答案]①Y1和Y2对X1,X2,X3,X4的多元线性回归分析Y1为应变量的方差分析表变异来源 离均差平方和 自由度 回归 误差 总变异316.258 4 25 29均方差 .650
Y1为应变量的参数估计变量 常数X1偏回归系数 -0.829
1.325 -0.124 -2.385标准误 47.773 0.197 0.282 2.783 0.765标准化偏回归系数- 0.165 0.714 -0.008 -0.494t -0.017
4.699 -0.045 -3.119P 0.986 0.249 0.000 0.965 0.005
复相关系数R =0.751,决定系数R2 =0.564。按α=0.05检验水准,回归方程中X2和X4有统计学意义,即低密度脂蛋白中的胆固醇与载脂蛋白B及载脂蛋白C有线性回归关系。与载脂蛋白B呈正相关,而与载脂蛋白C呈负相关。Y2为应变量的方差分析表
3.46725 2948.835
Y2为应变量的参数估计变量 常数X1偏回归系数 -2.132 0.483 -0.053 -0.294 -0.415标准误 13.951 0.058 0.082 0.813 0.223标准化偏回归系数- 0.825 -0.069 -0.046 -0.208t P-0.153 0.880 8.3850.000X2 X3 X4-0.640 0.528 -0.362 0.720 -1.858 0.075
此时,复相关系数R =0.885,决定系数R2 =0.783。按α=0.05检验水准,回归方程中只有X1有统计学意义,即高密度脂蛋白中的胆固醇含量与载脂蛋白AI有线性回归关系,并呈正相关。② 作Y
2/Y1关于X1,X2,X3,X4的逐步回归,选入水准α除水准α剔除选入=0.05,剔=0.10。Y2/Y1为应变量的方差分析表变异来源 离均差平方和 回归 误差 总变异
自由度 3 26 29均方差 0.094 0.002F
0.0000.283 0.052 0.336Y2/Y1为应变量的参数估计58常数X10.355 0.003 -0.004 0.0030.088 0.000 0.000 0.001- 0.583 -0.612 0.2164.018 7.357 -7.507 2.7000.000 0.000 0.000 0.012X2 X4
此时,复相关系数R =0.919,决定系数R2 =0.844。按α=0.05检验水准,回归方程中X1、X2和X4有统计学意义,即高、低密度脂蛋白中的胆固醇含量的比值与载脂蛋白B、载脂蛋白C和载脂蛋白AI有线性回归关系,并与载脂蛋白C及载脂蛋白AI呈正相关,而与载脂蛋白B呈负相关。与前面的回归结果比较,用Y2/Y1作应变量得到的回归方程R2=0.844,比单独用Y1或Y2作应变量得到的回归方程(Y1:R2=0.564;Y2:R2=0.783)要高,这提示:高、低密度脂蛋白中的胆固醇含量的比值,较低密度脂蛋白中的胆固醇含量或高密度脂蛋白中的胆固醇含量,对诊断动脉硬化可能更有价值。
(尹平)第十二章
统计表与统计图练 习 题一、单项选择题1.统计表的主要作用是A. 便于形象描述和表达结果
B. 客观表达实验的原始数据
C. 减少论文篇幅
D. 容易进行统计描述和推断
E. 代替冗长的文字叙述和便于分析对比2.描述某疾病患者年龄(岁)的分布,应采用的统计图是A.线图
C.百分条图
593.高血压临床试验分为试验组和对照组,分析考虑治疗0周、2周、4周、6周、8周血压的动态变化和改善情况,为了直观显示出两组血压平均变动情况,宜选用的统计图是A.半对数图
E.百分条图4.研究三种不同麻醉剂在麻醉后的镇痛效果,采用计量评分法,分数呈偏态分布,比较终点时分数的平均水平及个体的变异程度,应使用的图形是A. 复式条图
B. 复式线图 C. 散点图
E. 箱式图5. 研究血清低密度脂蛋白LDL与载脂蛋白B-100的数量依存关系,应绘制的图形是A. 直方图
B. 箱式图 C. 线图
D. 散点图 E. 条图答案:E D B E D 二、改表和绘图1. 某地调查脾肿大和疟疾临床分型的关系、程度与血片查疟原虫结果列表如下,此表有何缺点,请改进。
60[参考答案]本表的缺点有:(1)无标题,(2)横表目与纵标目分类不明确,标目设计不合理,“合计”不清晰,不便于比较分析;(3)线条过多,比例数小数位不统一。具体修改如下,见下表,也可以把血膜阳性分类单独列表。表
某地脾肿大程度和疟疾临床分型的关系脾肿 程度例数
脾Ⅰ 脾Ⅱ 脾Ⅲ 其他 合计105 51 15 3 174%(*)例数86.06
78.388 14 6 0 28%(*) 6.56例数 %(*)9 5 5 1 207.38 7.14例数 %(*)17 19 11 1 48
122 70 26 4 22254.96 51.53 11.71 1.80 10013.94
21.60血膜阴性
血膜阳性 间日疟
例数 %(△)合计20.00
12.61注:(*)表示行百分比,(△)表示列百分比
2. 试根据下表资料绘制适当统计图形。表
某地例正常人发汞值分布资料(μg/g)
[参考答案]本题需要应用直方图表示839例正常人发汞值分布情况,由于最后一组的组距与其它组不等,制图时转换成:矩形高度=组段频数/组距,即变成等组距。为保持原始数据的组距一致为0.2,也可把最后一组频数转换为36/(0.6/0.2)=12,频数图见下图。
61250200例数00.20.40.60.811.21.41.6发汞含量(μg/g)
某地例正常人发汞值分布图3. 根据下表分别绘制普通线图和半对数线图,并说明两种统计图型的意义。某地某年食管癌年龄别发病率(1/10万)年龄(岁) 40~ 45~ 50~ 55~ 60~ 65~ 70~ 75~ 80~男
6.9 19.3 50.2 68.5 86.2 97.0
[参考答案]将表中数据绘制成普通线图(见下图1),可以看出,60岁之前,男女食管癌年龄别发病率随年龄增长的变化趋势差异较小,60岁之后,男性随年龄变化食管癌发病率比女性增长较快,差异明显扩大。将表中数据绘制成半对数线图(见图2),不同性别随年龄变化食管癌年龄别发病率变化快慢程度相当,而且女性食管癌发病率趋势和转折点更清楚。应用半对数线图能够更恰当的表示相对指标女
6.7 16.4 12.5 19.9 15.2
62的变化趋势。
发病率(1/10万)707580年龄(岁)男女
某地某年不同性别食管癌年龄别发病率(1/10万)比较(普通线图)
707580年龄(岁)男女
某地某年不同性别食管癌年龄别发病率对数比较(半对数线图)
(张丕德,郭德成) 发病率半对数63第十三章
医学实验设计与诊断试验的评价练 习 题一、单项选择题1. 实验研究随机化分组的目的是A.减少抽样误差
B.减少实验例数C.保证客观
D.提高检验准确度
E.保持各组的非处理因素均衡一致2. 关于实验指标的准确度和精密度,正确的说法是A.精密度较准确度更重要
B.准确度较精密度更重要C.精密度主要受随机误差的影响
D.准确度主要受随机误差的影响E.精密度包含准确度3. 在临床试验设计选择对照时,最可靠的对照形式是A. 历史对照
B. 空白对照C. 标准对照
D. 安慰对照E. 自身对照4. 两名医生分别阅读同一组CT片诊断某种疾病,Kappa值越大说明A. 观察个体的变异越大
B. 观察个体的变异越小C. 观察一致性越大
D. 机遇一致性越大 E. 实际一致性越大5. 下列叙述正确的有A. 特异度高说明测量的稳定性好B. 灵敏度必须大于特异度才有实际意义C. 增大样本含量可以同时提高灵敏度和特异度D. 特异度高说明假阳性率低E. 阳性预测值高说明患病的概率大答案:E C D C C二、计算与分析64将100 名头外伤的急诊患者作为受检人群,用患者失去知觉的时间、头部表面外伤严重程度和神经检查结果作为有无颅骨骨折的新的综合诊断标准,与所有患者的影像诊断有无颅骨骨折进行比较,结果见下表,试计算其敏感度、特异度、总的符合率、阳性预测值、阴性预测值,并对该诊断试验标准进行评价。100名头外伤人群的疾病状态和诊断结果影像诊断有骨折无骨折合
[参考答案]:(1)计算评价指标 敏感度:Se?新的诊断方法 阳性 48(a) 10(c)
2(b) 40(d)
100 a48??0.96
a?b50d40??0.80 c?d50特异度:Sp?总的符合率:???a?d48?40??0.88 a?b?c?d100a48??0.828
a?c58d40阴性预测值:PV????0.952
d?c42阳性预测值:PV??(2)对该诊断试验标准进行评价PA?Pe?48?40?0.??21??0.50
???100?65Kappa
?PA?Pe0.88?0.500.38???0.76 1?Pe1?0.500.50S?1??0.09875U?Kappa0.76S??7.7000.0987U?U0.01 ,P?0.0166
上一篇: 下一篇:
All rights reserved Powered by
copyright &copyright 。文档资料库内容来自网络,如有侵犯请联系客服。

我要回帖

更多关于 医学统计学第三版 的文章

 

随机推荐