用什么方法描述一组数据偏离平均值的程度其均程度的统计指标

33.;?x?70?y?640n?10?x;?532;?y;?42816;要求:(1)计算线性相关系数;?xy?4754;《社会经济统计学原理》;第二次作业参考答案;(课程代码:00042);一、单项选择题:(本大题共10小题,每小题1分,;请将其代码填写在题后的括号内;1.有六名同学的统计学考试成绩(分)如下:;85,70,64,90,74,82;A64B
?x?70?y?640n?10?x
要求:(1)计算线性相关系数。(2)建立一元线性回归方程。(10分)
《社会经济统计学原理》
第二次作业
(课程代码:00042)
一、单项选择题:(本大题共10小题,每小题1分,共计10分)在每小题列出的四个备选项中只有一个是符合题目要求的,
请将其代码填写在题后的括号内。错选、多选或未选均无分。
1. 有六名同学的统计学考试成绩(分)如下:
85,70,64,90,74,82。成绩的中位数是(
D 78 2. 应用几何平均法求平均发展速度,目的在于考察( B )
D期中水平 3. 线性相关系数r的取值范围是(
-1≤r≤1 4. 平均指标可以反映总体分布的(
D 峰度 5. 按月平均法计算的季节比率之和应等于(
D 200% 6. 属于时点指标的是(
B 出生人口数
C 国内生产总值
D年末人口数 7. 采用三项移动平均修匀时间数列,那么所得修匀数列比原数列首尾各少(
) A一项数值
8. 已知某地区连续五年的工业增加值的环比增长速度为:5%,8%,10%,9%,11%,则五年工业增加值的平均增长速度是(
) A (5%?8%?10
%?9%?11%)?5
B (105%?108%?110%?9%?111%)?5
C 5.05?1.08?1.1?1.09?1.11?1
D 50.05?0.08?0.1?0.09?0.11?1 9. 假设检验中的弃真错误是指(
A原假设为真时不拒绝原假设
B原假设为真时拒绝原假设
C原假设为伪时不拒绝原假设
D原假设为伪时拒绝原假设
10. 拉氏指数的同度量因素是固定在(
C 任意时期
D 特定时期
二、多项选择题(本大题共5小题,每小题2分,共10分) 在每小题列出的五个备选项中至少有两个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选、少选或未选均无分。
11. 某人的年龄为20岁,则(
) A年龄为品质标志
B年龄为数量标志
C 20岁为品质标志
D 20岁为数量标志
E 20岁为标志值
12. 评价估计量的标准有(
E 一致性 13. 影响频数分布的要素有(
A 组距与组数
B 组限和组中值
D变量值的大小
E变量的性质 14. 两变量的关系中,线性相关系数小于0的有(
A产品产量与耗电量
B产品产量与单位成本
C商品价格与销售量
D 收入与纳税额
E 商品销售额与商品流通费用率
15. 概率抽样中,抽样误差的大小(
A可以事先计算
B不可以事先计算
D不可以避免
E可以适当控制 三、名词解释(本大题共5小题,每小题2分,共10分)
16. 统计指标体系―若干有联系的统计指标组成的一个整体,可系统反映现象的数量特征和相互的关系。
17. 统计量―用来描述样本特征的数值,统计量是样本的函数。
18. 抽样极限误差―指在一定的概率下抽样误差的可能范围,也称允许误差。其计算公式
19. 自变量―用来预测因变量的一个或多个变量,用x表示。 20. 频数分布―各个类别及其相应的频数形成的分布。
四、判断并改错(本大题共5小题,每小题2分,共10分)
21. 假设检验是在备择假设成立的前提下进行的。错误 改:假设检验是在原假设成立的前提下进行的。
22. 产品的产量是一个连续变量。错误
改:当产量以度量衡单位计量时,它是一个连续变量;当产量以自然单位计量时,它是一个
离散变量。
23. 按主词是否分组和分组的程度,统计表分为简单表、分组表和复合表。正确
24. 向上累计的累计频数表示:大于该组下限的频数共有多少。错误 改:向上累计的累计频数表示:小于该组上限的频数共有多少。
向下累计的累计频数表示:大于该组下限的频数共有多少。
25. 直方图是用方块的高度表示数据分布在某一区间上的频率或频数的大小。错误 改:直方图是用方块的面积表示数据分布在某一区间上的频率或频数的大小。
五、简答题(本大题共4小题,每小题5分,共20分)
26. 标志与指标有何区别与联系? 答:(1)标志是用来说明总体单位的特征,指标是用来说明总体的特征。
(2)标志分为:描述总体单位的质的特征、用文字表示的品质标志;描述总体单位的数量特征、用数值表示的数量标志。
(3)指标是描述总体的某一数量特征的,用数值表示。
(4)指标是通过标志汇总或计算得到的。没有标志,就无法得到指标。
(5)随着研究目的的改变,标志与指标存在着变换关系。比如,总体变成总体单位,指标就成了标志。
27. 平均发展水平与一般平均数的区别。 答:平均发展水平与一般平均数都是把现象在某一方面的数量差异抽象化,概括反映现象的一般水平。
(1)平均发展水平又称序时平均数、动态平均数,它是根据时间数列计算的;一般平均数又称静态平均数,它是根据变量数列计算的。
(2)平均发展水平所平均的是现象在不同时间上的数量差异,从动态上反映现象在一段时间内的一般水平。
(3)一般平均数所平均的是总体各单位某一数量标志的差异,说明总体在一定历史条件下的一般水平。
28. 变异指标的作用有哪些?
答:变异指标是反映一组数据与其均值的平均偏离程度的统计指标。包括:异众比率、四分位差、极差、平均差、标准差或方差、标准差系数。其作用有:
(1)变异指标可以表明平均指标的代表性。变异指标越小,平均指标的代表性越大;反之,亦然。
(2)变异指标可反映生产的稳定性。变异指标越小,生产的稳定性越好。
(3)变异指标可反映经济活动的均衡性。变异指标越小,经济活动的均衡性越好。
29. 回归分析的内容是什么?
答:回归分析的内容包括:
(1)从一组样本数据出发,确定变量之间关系的数学关系表达式。 (2)对数学关系式的可信程度进行统计检验。
(3)利用所求的关系式,根据一个或几个变量的取值去估计另一个变量的取值,并给出这种估计的可靠程度。
六、计算题(本大题共4小题,每小题10分,共40分)
要求列出计算步骤,结果保留两位小数。
30. 已知甲班同学数学的平均成绩为78分,成绩的标准差为10分。又知乙班同学的数学
分) 4590?5x乙60?76.(分)
?10.39(分)60?1
??0.13676.5x
??0.12878x
?V甲?V乙?甲班平均成绩的代表性大与乙班。
试从相对数与绝对数两个方面,分析由于价格和销售量的变化对销售额的影响。(10分)
三亿文库包含各类专业文献、中学教育、文学作品欣赏、专业论文、应用写作文书、外语学习资料、18社会经济统计学原理及答案等内容。 
 社会经济统计学练习题 3-6 《社会经济统计学原理》 第三次作业 参考答案 (课程代码:00042)总分 核分人 复查人 题号 题分 得分 一二三四五六 得分 1. 2....  社会经济统计学原理试题及答案_人力资源管理_经管营销_专业资料。社会经济统计学原理试题及答案 统计学原理 试题( A )一、 填空题 ( 每小题 1 分,共 10 分 ...  社会经济统计学原理试题及答案 作者:湖北自考… 文章来源:湖北自考在线 点击数: 更新时间: 11:46:35 一、填空题(每空 1 分,共 10 分) 1.从...  社会经济统计校考题及答案_经济学_高等教育_教育专区。《社会经济统计学原理》(课程代码 00042) 第一大题:填空题 1、标志按其特征的不同,可以分为品质标志与 数...   专注于收集各类历年试卷和答案 全国 2007 年 4 月高等教育自学考试 社会经济统计学原理试题课程代码:00042 一、单项选择题(本大题共 10 小题,...  社会经济统计学原理试题_调查/报告_表格/模板_应用文书。自考历年试题,但没有找到答案,欢迎上传答案作补充社会经济统计学原理试题 全国 2002 年 4 月高等教育自学考...  (10 分) 《社会经济统计学原理》 第一次作业 参考答案(课程代码:00042)总分 核分人 复查人 题号 题分 得分 一二三四五六 得分 评卷人 复查人 一、单项...  经济统计学原理习题库答案_管理学_高等教育_教育专区。上次只上传了题目,没有答案...A.抽象的数量关系 B.社会经济现象的规律性 C.社会经济现象的数量特征和数量...  《社会经济统计学原理》(课程代码00042)_社会学_人文社科_专业资料。第一大题:填空题 1、标志按其特征的不同,可以分为品质标志与___。 参考答案:数量标志 2、...君,已阅读到文档的结尾了呢~~
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
统计数据的描述
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口当前位置: >>
Evidence-based Medicine第五章 循证医学实践中常用的 统计指标与方法 常见的统计学错误1. 统计指标的误用 率与构成比,发病率与患病率,死亡率与病死率混淆。 2. 对照设计不合理 两组例数太少或悬殊太大。一般说来,计数指标每组样 本不得少于20~30 例,计量指标不得少于5~10 例。 3. 样本选
择/分组描述不当 应写明研究对象随机化抽样和分配的具体方法。 4. 统计表图不规范 5. 统计方法错误Evidence-based Medicine Evidence-based Medicine学习目标 掌握数据资料的类型;定量资料和定性 资料统计描述常用的指标;循证医学常 用的描述指标EER、CER、RR、OR、 RD。 会熟悉运用基本的统计学方法。 了解t检验、F分析和?2 检验的适用条件。 Evidence-based Medicine证据的提供者(doer)应该正确选用统 计方法进行数据处理,从而确保所提供 的证据真实、可靠。 证据的应用者(user)应能评判某研究 证据中所使用的统计方法的正确与否, 以此推断其结果的真实性和可靠性。 因此,学习并掌握有关的统计方法,对 循证医学的研究者和应用者均是重要的 内容。 第一节 统计方法抉择的基本原则在科研活动中,正确地采用统计分析方 法,应充分考虑科研工作者的分析目的、 临床科研设计方法、搜集到的数据资料 类型、数据资料的分布特征与数理统计 条件等。对临床科研数据进行统计分析 和评价时,应考虑下列因素:Evidence-based Medicine 一、分析目的在进行科研以前,研究者一定要明确利用统计 方法达到的什么目的,从而选择合适的统计方 法。 一般来说,统计方法分为统计描述与统计推断 两类。Evidence-based Medicine统 计 方 法统计描述 统计推断参数估计假设检验点估计 区间估计 Evidence-based Medicine统计描述(descriptive statistics): 对原始数据进行归纳整理,利用统计指 标(如率、均数)、统计图或者统计表, 对数据资料进行的最基本的统计分析, 使其能反映数据资料的基本特征,有利 于研究者能准确、全面地了解数据资料 所包含的信息,以便做出科学的推断。 某地年痢疾与百日咳死亡率(1/10万)Evidence-based Medicine年度痢疾1.45 0.82百日咳0.22 0.05198519900.230.140.020.01 Evidence-based Medicine Evidence-based Medicine Evidence-based Medicine? ? ? ? ? ? 1 / 1 0 ? ò1.6 1.4 1.2 1 0.8 0.6 0.4 0.2 0 85 1990? ? ? ?? ? ° ? ? ?? 2-11 ? ? ê ? ? ? ? ° ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ¨1/10? ò ? ? Evidence-based Medicine统计推断(inferential statistics): 用样本信息估计总体参数所在范围和用 样本信息推断总体特征。 包括参数估计和假设检验。 Evidence-based Medicine参数估计:用样本指标估计总体指标。 包括点估计(point estimation)和 区间估计(inteval estimation )。 Evidence-based Medicine点估计:用样本统计量直接作为总体参数 的点估计值。 未考虑抽样误差的大小。一般不用。 抽样误差:由于个体差异和抽样造成 的统计量与参数之间的差异,不可避免。 但是可通过增加样本来减少误差大小。 Evidence-based Medicine区间估计:即按预先给定的概率(1-α)估计 包含未知总体参数的可能范围。该范围称参数 的可信区间(Confidence intervel ,CI)。 α为可信系数,一般取0.05或者0.01,1- α 又叫可信度或置信度常取95%和99%。 95%的置信区间(CI): 有95%的可能认为计算出的可信区间包含了 总体参数。 Evidence-based Medicine此外,若要研究某些因素间的相互联系 时,可用相关分析,用相关系数来衡量 各因素间的相关性的大小。如研究身高 与体重的相关性,高血脂与冠心病的相 关性。 二、资料类型通常情况下按资料定量或定性属性可分 为定量资料和定性资料。 定量资料(quantitative data):又 称为计量资料或者数值变量资料。对每 个观察单位用定量方法进行测量所得的 数据。变量值有数值大小,有度量衡单 位。如身高、体重。Evidence-based Medicine Evidence-based Medicine定性资料(qualitative data):又称 为计数资料或者分类变量资料。其观察 值是无法定量或不能测量的变量,是定 性的,其表现为互不相容的类别或属性。 分类变量又可分为两种情况: (1)无序分类:变量表现为没有大小之 分的属性或类别。如性别是两类无序分 类变量,血型是四类无序分类变量。 (2)有序分类:变量表现为各属性或类 别间有程度之分。如临床上某种疾病的 “轻、中、重”,治疗结果的“无效、 显效、好转、治愈”。分为单向有序和 双向有序。 Evidence-based Medicine资料类型不同,选用的统计方法不同 如定量变量资料的比较可选用t检验、u 检验、方差分析等统计方法,定性资料 的比较,如率的比较多用卡方检验。 在有些文章中,由于资料类型的误判而 导致了统计方法的误用。最常见的错误 是将数值变量资料错判为分类变量资料。 三、设计方法在众多的临床科研设计方法中,每一种设计方 法都有与之相适应的统计方法。因此,必须要 根据不同的临床科研设计方法来选择相适应的 统计分析方法。如果统计方法的评价与设计方 法不一致,统计分析得到的任何结论都是错误 的。 如成组设计(完全随机设计)的t检验,配对 设计资料的t检验;完全随机设计资料的方差 分析,配伍组设计资料的方差分析;拉丁方设 计资料、析因设计资料等等。Evidence-based Medicine 四、数理统计条件Evidence-based Medicine数理统计和概率论是统计的理论基础。 每种统计方法都要涉及数理统计公式。 而这些数理统计公式都是在一定条件下 推导和建立的。也就是说,只有当某个 或某些条件满足时,某个数理统计公式 才成立。 Evidence-based Medicine在数理统计公式推导和建立的条件中, 涉及最多的是数据的分布特征。许多数 理统计公式都是在特定的分布下推导和 建立的。 如果实际资料服从某种分布,即可用该 分布所具有的数理统计公式来分析和处 理实际资料,反之则不能。 Evidence-based Medicine在临床资料的统计分析过程中,涉及最 多的分布是正态分布、偏态分布和二项 分布。除了数据的分布特征外,有些数 理统计公式还有其它一些条件,如样本 含量大小、理论频数大小、方差齐性等。 Evidence-based Medicine 第二节 统计学基础一、计量资料的统计描述 描述定量资料基本特征的指标 一是集中趋势的指标,反映一组数据的 平均水平; 二是离散程度的指标,反映一组数据的 变异大小; 两类指标联合应用才能全面描述一组定 量数据的基本特征,是目前统计中应用 最重要和最多、最广泛的指标体系。Evidence-based Medicine 描述数值变量资料平均水平的常用指标:均数或算术平均数、中位数和几何均数等Evidence-based Medicine描述数值变量资料离散程度的指标:标准差、四分位间距和变异系数等 表1 数值变量的常用描述指标指标名称均数作用描述一组数据的平均水平,集中位置适用的资料正态分布或近似正态分布 偏态分布、分布未知、两端无 界 对数正态分布,等比资料 正态分布或近似正态分布 偏态分布、分布未知、两端无 界 观察例数相近的数值变量 比较几组资料间的变异大小x中位数(M) 与均数相同Evidence-based Medicine几何均数 ( G)与均数相同标准差(S) 描述一组数据的变异大小,离散程度 四分位数间 距 极差(R) 变异系数 (CV) 与标准差相同 与标准差相同 与标准差相同 Evidence-based Medicine每个指标都有其适用范围,因而应该根 据实际资料的情况选择使用。 服从正态分布或近似正态分布,选用 均数和标准差 不服从正态分布,选用 中位数和四分位间距 目前Meta分析中的数值资料统计分析方 法,主要是建立在正态分布基础之上, 而对于非正态分布资料的统计分析方法 尚在发展和完善之中。 ?x x x? nEvidence-based Medicine1、算术平均数(arithmetic mean) 总体均数用希腊字母μ,样本均数用 X 样本例数用 n 表示。 ? 均数的适用范围:对称分布,尤其正态或近 似正态分布的资料。 ? 均数的计算方法: 直接法(用于n≤30) 加权法(用于n&30) ? x 2x 2 ?Evidence-based Medicine?x22、标准差(standard deviation,s ) 是描述正态分布的定量变量离散程度的指标。 标准差越大,说明个体变异越大。 (? x ) 标准差的计算: x ? ? n2 2s?n ?1公式中 是变量值的平方和 , 是变量值和 的平方。?x2 2 ( ? x) 例1:如今有5名儿童的身高为110、115、 120、125、112厘米,求其其平均身高和标 准差。Evidence-based Medicinex?? x ? 110 ? 115 ? 120 ? 125 ? 112 ? 582 ? 116.4n 5 52 2 2 2 x ? 110 ? 115 ? ? ? 112 ? 67894 ?其标准差是:s?2 ( ? x ) ?x ? 2n ?1n ? 67894 ? 5 ?158225? 6.1 二、计量资料的统计推断(一)点估计及可信区间估计 均数的抽样误差(Sampling error of mean) 由于个体存在差异,又因抽样造成的样本均数 与总体均数间的差异,称为均数的抽样误差, 用均数的标准误 (Standard error ,SE) 表示。 均数的标准误是表示均数抽样误差大小的指标, 描述样本均数的离散程度,反映用样本均数估 计或推断总体均数的可靠性.Evidence-based Medicine 在均数为μ,标准差为σ的正态总体中作随机抽 样,则样本均数服从正态分布,样本均数的均 数为μ,样本均数的标准误为Evidence-based Medicine?在实际应用中,总体标准差σ常常未知,需要用样本标准差s来估计。即样本均数标准误的估计值 为 Evidence-based Medicine例2 2000年某研究者随机调查某地健 康成年男子27人,得到血红蛋白量的均 数为125g/L,标准差为15g/L。试估计 该样本均数的抽样误差。SX ? S n ? 15 27 ? 2.89 g / L 置信区间的计算 1、t分布法σ未知或 n较小(n&50)时:95%的CI:Evidence-based Medicine99%的CI: 例3 已知某地27名健康成年男子的血红蛋白 均数 ,n=27 问该地健康成年男子血红蛋白含量的95%置 信区间和99%置信区间各为多少? Evidence-based Medicine Evidence-based Medicine Evidence-based Medicine或 该市正常成年男子Hb总平均含量的95% 置信区间为119.06g/L~130.94g/L。 该市正常成年男子Hb总平均含量的99% 置信区间为116.98g/L~133.02g/L。 注意区别估计置信区间须兼顾置信度和精确度两要素: 置信区间比较:百分数越大,可信度(置信度) 越大,但所得区间范围也越宽,其精确度就越 低。所以,为兼顾到可信度和精确度两个要素, 故一般计算95%和99%的两个置信区间。Evidence-based Medicine 2、正态分布近似法当总体标准差σ已知时,或 σ 未知但n足够 大( n&50)时: 95%的CI: 99%的CI:Evidence-based Medicine例4 某市2000年随机测量了90名19岁健 康男大学生的身高,其均数为172.2,标 准差为4.5cm,试估计该市2000年19岁 健康男大学生平均身高的95%置信区间。 95%的CI : X ? 1.96 S XEvidence-based Medicine4.5 ? 172.2 ? 1.96 ? ? (171.3,173.1)cm 90 99%的CI : X ? 2.58S X 4.5 ? 172.2 ? 2.58 ? ? (171.0,173.4)cm 90 (二)假设检验Evidence-based Medicine在众多的医学科研方法中,归纳起来最基本的 手段有两种: 一是对研究对象的全体进行研究,如普查。这 种方法只能用于有限总体,况且需要花费的人 力、物力和时间较多,往往难以实现。 二是从总体中抽取一定数量的样本进行抽样研 究,然后利用得到的样本统计量对总体参数进 行推断。 Evidence-based Medicine在抽样过程中不可避免的要产生由于抽 样所致的样本与总体的差别,即抽样误 差。因此,在利用样本数据对总体进行 推断的时候,必须要考虑抽样误差对结 果的影响。 若用样本信息去推断其所代表的总体间 有无差别时,需要使用假设检验 (hypothesis test)。 Evidence-based Medicine假设检验原理: 首先假设样本来自的总体的参数相同, 然后根据样本数据计算的检验统计量进 行判断,样本信息支持这种假设的概率 大小,并作出结论。 Evidence-based Medicine概率(probability): 描述随机事件发生可能性大小的数值。 用p 表示。P在0~1间 P=1 表示某事件必然发生 ,叫必然事件。 P=0 表示某事件必然不发生 ,叫不可能事件; 0& P&1表示某事件可能发生,也可能不发生, 叫随机事件; p≤0.05为小概率事件,即在一次观察中发生 的可能性很小。 假设检验1. 目的:是由样本推论样本代表的总体与已 知总体是否一样,而不是为了说明样本本身。Evidence-based Medicine2. 假设检验的基本方法:假设μ0 = μ1 计算一个统计量, H0成立的 可能性即概率P多大,P较小, P不很小, 不成立,拒绝H0 不能拒绝,接受H0 Evidence-based Medicine例3 某医生测量了36名铅作业男性工人的血红蛋 白含量,计算得到其均数为130.83g/L,标准差为 25.74g/L。已知正常男性血红蛋白平均值为140g/L, 问从事铅作业工人的血红蛋白是否不同于正常成 年男性平均水平?s ? 25.74g/L n ? 36X ? 130.83g/Lμ0= 140g/Lμ=? 造成差异的可能原因:① 样本来自的总体均数等于140 ,即 ? ? ?0 表示目前的差异是由抽样误差造成的。Evidence-based Medicine;② 样本来自的总体均数小于140,表示两者差 异不是由抽样误差造成的,而存在本质上的 差别。用假设检验―根据定义先作假设―再检验。 检验中的两个假设:H0 ,(又称为零假设,null hypothesis):“总体均数等于 140”。如果该假设成立,表示目前的差异是由抽样误差 引起的。Evidence-based Medicine另一假设计为H1 ,(又称为“备择假设”,alternative hypothesis):“总体均数小于140”。若该假设成立,表示 目前的差异不是由抽样误差所致,而是两总体原本不同, 存在本质上的不同。 将样本来自的总体均数记为μ,已知的总体均数记为μ0, 则两个假设可表示为:H 0 : ? ? ?0 ? 140, H1 : ? ? ?0 ? 140 假设检验的基本步骤 1.建立检验假设并确定检验水准。H0: 两总体均数相同 H1: 两总体均数不同 ?=0.05(单、双侧)Evidence-based Medicine检验水准:决策者事先规定一个小的概率值α,允许假 设检验的结论犯错误的概率限值,称为检验水准。通常 取0.05 或0.01。2.选择检验方法,计算相应的检验统计量。假设检验方法很多,因资料类型、设计类型、样本 含量等不同而不同。 定量资料:t检验、F检验Evidence-based Medicine一组样本资料的t检验 配对设计资料的t检验 两组独立样本比较的t检验 多组样本比较的F检验 定性资料:?2检验配对设计资料的?2检验 两组样本比较的?2检验 多组样本?2检验 Evidence-based Medicine3. 判断P值。 即H0成立的概率。 |t|?t (?, ?),P??,拒绝H0,接受H1 |t|&t (?, ?),P&?,不拒绝H04. 推断结论。 按?=0.05水准,可以认为…差别有统计学意义) 或无统计学意义)。 第三节计量资料的统计分析一、一组样本资料的 t 检验Evidence-based Medicine(一)检验目的:推断样本来自的总体均数μ 是否与某已知数值μ0相等。 (二)适用条件:要求样本来自正态总体。 (三)公式:X ? ?0 t? ~ t分布, ? ? n - 1 Sx X ? ?0 t? S/ n H 0 : ? ? ?0 ? 140, H1 : ? ? ?0 ? 140,? ? 0.05Evidence-based MedicineX - ?0 130.83 ? 140 本例 t ? ? ? ?2.138 S/ n 25.74 / 36 ? ? n ? 1 ? 36 ? 1 ? 35 可认为从事铅作业男性工人血红蛋白含量低于正常成年男性。t ? t( 0.05,35) ? 1.690, p ? 0.05, 按? ? 0.05检验水准,拒绝H 0 , 接受H 1, 二、配对设计资料的t检验配对设计:将条件相同或相近的两个受试对象配 成对子,再将每对中的两个受试对象随机分配到 不同处理组。 (一)检验目的:差值d的总体均数?d是否为0。 (二)适用条件:要求差值d服从正态分布。 (三)公式Evidence-based Medicined ?0 t? ~ t分布 , ? ? n - 1 Sd d ?0 t? Sd / n Evidence-based Medicine例4 为了研究被动吸烟对小鼠体重的影响,某研 究者把20只小鼠按性别与体重配成10对,实验 组给予2次的被动吸烟,对照组没有被动吸烟, 1个月后观察体重变化,得到数据如下(p79), 请分析被动吸烟是否对小鼠体重增长有影响。 三、两组独立样本资料的t检验(一)检验目的:推断两样本来自的总体均数是否 相等。 (二)适用条件:要求样本来自正态总体;样本来 自的两总体方差相等。(三)公式 t ? X 1 ? X 2 ~ t分布,? ? n ? n ? 2 1 2Evidence-based MedicineS x1 ? x2S x1 ? x22 2 ? ? ? ? ? ? 1 1 n ? 1 S ? n ? 1 S 2 1 1 2 2 ? ? Sc2 ? ? , S ? C ?n n ? n1 ? n2 ? 2 2 ? ? 1 例5 为研究饲料中维生素E缺乏对肝中维生素A含 量有无影响,将20只大鼠随机分为两组,分别喂以 正常饲料和维生素E缺乏饲料。4周后将大鼠处死, 测定其肝中维生素A的含量,数据如下(p80),请做 统计分析?Evidence-based MedicineH 0 : ?1 ? ? 2 ( 维生素E缺乏对肝中维生素 A含量无影响)? ? 0.05H1:?1 ? ?(维生素 E缺乏对肝中维生素 A含量有影响) 2 n1 ? 10, X1 ? 33.9, S1 ? 6.2973 n2 ? 10, X 2 ? 26.0, S 2 ? 5.5377 2 SC2 2 ? n1 ? 1?S1 ? ?n2 ? 1?S 2 ?n1 ? n2 ? 22 ? 10 ? 1?? 6.2973 ? ?10 ? 1?? 5.53772 ?10 ? 10 ? 2? 35.161Evidence-based Medicinet?X1 ? X 2 1 1 ? 2? ? Sc ? ? ?n ? n 2? ? 1??1/10 ? 1/10? 35.16133.9- 26.1? 2.98? ? n1 ? n2 ? 2 ? 20 ? 2 ? 18 查附表2(t界值表),t&t0.05,(18)==2.101, 则 p&0.05,在α=0.05水准上拒绝H0,接受H1。即认 为维生素E缺乏对肝中维生素A含量有影响。Evidence-based Medicine 方差分析方差分析Evidence-based Medicine完全随机设计的(成组)--单因素 随机区组设计(配伍组)--双因素 拉丁方设计,正交设计,析因设计 ---多因素一、单因素方差分析的定义只分析处理组间有无差别,以说明研究因素对 结果有无影响的检验方法。 二、单因素方差分析的设计基本思想:把所有观察对象之间的变异叫总变异 分成 组间变异(处理因素的影响)用MS间表示Evidence-based Medicine组内变异(个体因素的影响)用MS内表示如果处理因素确无效的话, 如果处理因素确有效的话,则 F值越大,P值越小,就越有理由认为组间有差别。 三、方差分析的用途与要求条件用途 1、用于多个样本均数(或两个)的比较 2、用于分析因素间的交互作用 3、用于方差齐性检验 4、用于方程的拟合度检验 要求条件 1、各样本是随机独立的 2、各样本来自正态总体 3、各总体方差相等 即Evidence-based Medicine 完全随机设计资料的方差分析(One-way ANOVA)以课本p83例5-4介绍其基本步骤:Evidence-based Medicine1、建立假设,确定检验水准H0:3期血清铜蓝蛋白的测定结果的总均数相 等, H1:3期血清铜蓝蛋白的测定结果的总均数不 全相等。2、求F值 (3) 确定P值,做出推断结论: 根据?处理 和 ? 组内, 查附表 3 的 F 界值表。Evidence-based Medicine若F≥F?(? 1,? 2),则P≤?。按?水准,拒绝H0, 接受 H1,认为有统计学意义。可以认为多 个总体均数不全相同,即多个总体均数中 至少有两个不同。 若 F&F?(? 1,? 2) ,则 P&? 。按 ? 水准,不拒绝 H0,认为无统计学意义。还不能认为多个 总体均数不全相同。 Evidence-based Medicine 样本均数与总体均数的比较:小样本正态,t;大样本,u. 配对设计资料:正态:t; 非正态:符号秩和。 成组设计 小样本 两样本 两组比较的秩和检验(wilcoxon) 非正态 数据变换后用 t 或 F 检验 比较 大样本:u 检验 成组设计 正态 方差齐:F检验 多样本均 分布 方差不齐:F′ 检验(近似F检验) 数比较 非正态: 多组比较的秩和检验(Kruskal-Wallis test) 配伍组设计:正态:同成组设计多样本比较; 非正态:秩和检验M(Friedman) 多个样本均数间两两比较:正态、方差齐:q检验; 非正、不齐:秩和 多个处理组与同一对 正态方差齐:Dunnett-t检验 照组均数间两两比较 非正、方差不齐:秩和 正态 分布Evidence-based Medicine计 量 资 料 第四节 计数资料的统计分析(一)计数资料的统计描述Evidence-based Medicine(二)率的点估计与区间估计(三) ?2 检验 Evidence-based Medicine(一)计数资料的统计描述 定性资料:先按观察单位的性质或类别分 组,然后清点(各组的例数)得出的数 据。 对于定性资料的分析与比较常用相对数 relative number). Evidence-based Medicine频率型常用相对数指标构成型相对比型 1、构成比 (constituent ratio)Evidence-based Medicine又称结构指标、构成指标、百分比。 表示定性事物内部各组成部分所占比 重或分布特征的指标。计算:某部分 构成比 ? ?100% 各部分的总和 表1 某医院2001年住院病人5类疾病死亡构成疾病种类 恶性肿瘤死亡人数 50 30 20 40 10 150百分比(%) 33.33 20.00 13.33 26.67 6.67 100.00Evidence-based Medicine呼吸系统疾病 消化系统疾病 循环系统疾病 传染病 合 计 Evidence-based Medicine Evidence-based Medicine构成比的特点: ①各构成部分可相加,总和为 100%。 ②其中某部分有增(减)时,其他 部分也相应改变。 2、率(rate)Evidence-based Medicine又称频率指标、强度指标。表示某现象 发生的频率和机会大小的指标,用来反 映事物的严重程度。计算公式:某现象实际发生数 率? ?K 该现象可能发生总数K :比例基数。K可以是100%、1000‰、万/万或10万/10万等。 定K的原则有:Evidence-based Medicine(1)按习惯定:如医院多用百分率,如有 效率、病死率、治愈率等;人口统计多用 千分率,如婴儿出生率、死亡率、人口自 然增长率;而肿瘤的发病率、死亡率多用 万分率、或十万分率。 (2)使计算结果保留1~2位整数为宜。 3、比(ratio)Evidence-based Medicine又称相对比(relative ratio)。 表示任何两个有关联的事物之比, 说明两事物的相对水平。通常用倍 A 比? (?100%) 数或百分数表示。 B A、B两个指标可以是绝对数、相对 数或平均数。 常用的相对比指标有三种: ⑴对比指标:指两个同类事物某指标的 比。 例如:我国2009年人口普查结果,男 女性别比例是119.45:100 ,这里的 性别比属于同类事物,习惯于以女性为 基数。还可表达成男:女=1.19:1Evidence-based Medicine Evidence-based Medicine⑵关系指标:指两个有关的、但非同类事物的 数量的比。 如医院医护人员与病床数的配比为1:1.6, 即每名医护人员平均负责1.6张病床。这里 医护人员与床位数之比,是两个非同类事物, 单位也不同,但两者有密切关系。 Evidence-based Medicine⑶计划完成指标:指计划完成的程度,常用 实际数达到计划数的%或几倍表示。 如某单位计划在某人群中接种肝炎疫苗 3000人,实际接种2400人,计划完成 指标×100%=80%,即 实际完成是计划完成数的80%。 也可用倍数表示。如0.8倍 表2 年某地损伤、 中毒病死率(%)与构成比(%)年度 ( 1) Evidence-based Medicine 1993 发病人数 ( 2) 584 病死人数 ( 3) 8 病死率 ( 4) 1.37 构成比 ( 5) 8.8 相对比 ( 6) ――1994199557171410121.751.6811.013.21.281.231996 合计748942 1621 24 912.142.23 2.19 1.9617.623.0 26.4 100.01.561.63 1.60 ―― 根据表(4)栏分析:1993年~1998年间 损伤与中毒病死率呈逐年上升趋势, 1998年略有下降。Evidence-based Medicine根据表(5)栏可见,93年病死数占病死总 数的比重最小,而98年所占比重最大。 根据表(6)栏可见:以93年为基数,以后 各年度的病死率与93年的比较的倍数基本 是(98年除外)越来越大。 4、应用相对数应注意的问题(1)计算相对数的分母不宜太小。因例数 少计算的相对数不可靠。Evidence-based Medicine(2)分析时防止概念混用,不能用构成比 代替率。因构成比只说明事物内部各构成 部分所占比重或分布状况,并不说明某现 象发生的频率或强度。 3、不能用构成比的动态分析代替率的动态分析。表3 某市1980年和1990年5种传染病情况疾病 1980年 1990年病例数 构成比(%) 病例数 构成比(%)8 890 902
16.49 9.65 12.20 12.36 100.00 2 767 875
21.33 10.11 14.31 16.33 100.00Evidence-based Medicine痢疾肝炎流脑 麻疹 腮腺炎 合计 4、正确计算总平均率。表4 某化工厂慢性气管炎患病与专业工龄关系工龄(年) 检查人数Evidence-based Medicine患者数 17百分比 11.56患病率(%) 5.001~3405~10~ 15~ 合计254432 136 11623073 27 14720.4149.66 18.37 100.0011.8116.90 19.85 12.65总平均患病率=147/%=12.65% 5、相对数比较时应有可比性。(1)观察对象同质:即除了观察因素外,影响Evidence-based Medicine相对数大小的其他因素,应尽量相同,才属于同 质,才有可比性。如比较甲乙两种方法的治愈率 时,除了两种方法不同外,影响治愈率大小的因 素有年龄、病因、病型、病情严重程度等因素应 尽量相同。 (2)总率间比较时,如内部构成不同,应进行率 的标准化。 Evidence-based Medicine6、样本率(或构成比)比较时,应作假 设检验。 常用相对数的区别相对数 意义 表示方式 计算公式构成比Evidence-based Medicine表示事物内部各组成部分所 占的比例或分布状况。百分数率表示某时期某事物发生的频 百分率、千分率、 率或强度。 万分率等。比表示两个有关联事物之比。倍数或 百分数 Evidence-based Medicine(二)率的点估计与区间估计 1、点估计:用样本频率p作为总体概率 π的点估计值。 点估计的方法简单,但没有考虑抽样误 差,无法评价估计值与真值之间的差距。 Evidence-based Medicine2、区间估计:结合样本统计量和标准误 可能确定一个具有较大置信度的包含总 体参数的区间,该区间成为总体参数的 1-α的可信区间(CI)。通常α取0.05 或者0.01,所以1-α为95@或者99%。 通常用样本频率及其标准误估计总体频 率的可信区间。 根据样本含量n和样本频率p的大小,用查表法或 正态近似法计算总体概率的可信区间。 1、查表法:Evidence-based Medicine例1 某医院对39名前列腺癌患者实施开放手术治 疗,术后有合并症者2人,估计该手术合并症发生 率的95%的置信区间。 因为n&50, p=2/39=5.1% np=1.99&5 查附表6:95%CI=1%~17% 即该手术合并症发生率的95%的置信区间是1%~ 17%。 Evidence-based Medicine Evidence-based Medicine注意: 当发生数x&n/2,应以n-x 和n查表,然后从100 中分别减去查得数值为所求的置信区间。 如:n=31 x=25 &n/2 ,所以用31和31-25=6查 附表6.2查得8~38,从100-8=92,100-38= 62 即95%的置信区间是62%~92%。 2、正态近似法: 当n足够大,且np&5 或 n(1-p)&595%的CI: 99%的CI:p ? 1.96p ? 2.58 p(1 ? p) np(1 ? P) n Evidence-based Medicine例2 用某种仪器检查已确诊的乳腺癌患者 120名,检出乳腺癌患者94例,检出率 是78.3%,估计该仪器总检出率为多少? 因n较大,np&5, n(1-P)&5 95%的置信区间:该仪器乳腺癌总检出率95%可能是70.9 %~85.7%之间。 99%的置信区间:Evidence-based Medicine该仪器乳腺癌总检出率99%可能是67.3%~ 89.3%之间。 (三) ?2 检验(卡方检验)Evidence-based Medicine用于定性资料的一种假设检验方法。 ? 检验的用途2Evidence-based Medicine1.用于两个样本率或构成比的比较 ------完全随机设计四格表?2检验 2.用于多个样本率或构成比的比较 ------完全随机设计R×C表 ?2检验 3.用于两变量间有无关联的判断 ------配对设计列联表?2检验 (一) 四格表?2 检验一、基本原理:以例3说明Evidence-based Medicine例3 某研究者欲研究两种药物治疗慢 性咽炎患者的疗效,将病情相似的80 例患者随机分成两组,分别用兰芩口服 液和银黄口服液治疗,数据如下表,试 问两种药物的疗效有无不同? 表5两种药物治疗慢性咽炎的疗效疗效Evidence-based Medicine药物 有效 兰芩口服液 银黄口服液 合计 41(36.56) 24(28.44) 65 无效 4(8.44) 11(6.56) 15合计有效率 (%)45 35 8091.11 68.57 81.25 414 11上例中, 简称AEvidence-based Medicine24的四个数叫实际频数,(actual freqency)。这4个数据是基本的,组成四格表,其余 数据都是由四个数据计算出来的。 四格表?2检验 基本公式:Evidence-based Medicine?式中,?2为检验统计量。 T为理论频数,理论上应该发生的数。 各组例数与理论发生率相乘。 Evidence-based MedicineTij表示第i行第j列的理论频数。ni表示i行的合计数 mj表示j列的合计数简便算法… Evidence-based Medicine理论频数(theoretical freqency,T) 按照合并有效率Pc=81.25%为理论有效率来推算各 格T: T11 =45× 81.25% =36.56 ,即45 ×65/80 T12=45 × (1- 81.25%)=8.44 ,即45 ×15/80 T21=35 × 81.25% =28.44, 即35 ×65/80 T22=35 × (1- 81.25%) =6.56,即35 ×15/80药物有效 疗效 无效合计有效率 (%)兰芩口服液银黄口服液 合计41(36.56)24(28.44) 654(8.44)11(6.56) 154535 8091.1168.57 81.25 二、?2 检验的步骤:1、建立假设,确定α水准 H0:π1= π2 ,或两总体率相等(两药物疗效相同) H1:π1≠ π2 ,或两总体率不相等(两疗效不同)。 α =0.05Evidence-based Medicine 2、选择检验方法,并计算检验统计量Evidence-based Medicine2 ( A ? T ) 2 ? ?? T 2 2 2 2 (41 ? 36.56) (4 ? 8.44) (24 ? 28.44) (11 ? 6.56) ? ? ? ? ? 6.57 36.56 8.44 28.44 6.56 3、确定P值,并作出结论2 根据自由度和事先确定的检验水准,查? 界值表(附表8,P449):Evidence-based Medicine,两率的差别有统计学意义。,两率差别无统计学意义。 本例查?2 界值表,得? 2 0.05(1)=3.84 本例中, ? 2 =6.57&3.84,P & 0.05,Evidence-based Medicine按α =0.05水准,拒绝H0 ,两样本率的差别有统计学意义。 可以认为两种药物对慢性咽炎的疗效不同,兰芩口服液组的 有效率高于银黄口服液。 根据? 2值的计算及其与P值的关系,理解:?2 检验的基本思想(原理):?2值反映了实际频数与理论频数相吻合的程度。Evidence-based Medicine若A和T吻合程度很高? ?2值就会很小?越容易小于? 2界值?越容易有p&α?接受H ?差别无统计学意义。 0 (两样本率的差别是由抽样误差造成) 若A和T吻合程度很低,即两者差别很大? ?2值很大, 容易大于?2界值? 越容易有p≤ α ?容易拒绝H0 ? 差别有统计学意义。 (两样本率的差别是由于本质上的不同引起的)。 三、四格表? 2检验的专用公式:? ? ad ? bc n ?2= ?a ? b??c ? d ??a ? c ??b ? d ?241(a)4(b)a+bc+d24 (c)11(dEvidence-based Medicinea+c2b+dn2 (ad ? bc)2 n (41?11 ? 24 ? 4) ? 80 ? ? ? ? 6.57 (a ? b)(c ? d )(a ? c)(b ? d ) 45 ? 35 ? 65 ?15用专用公式计算的结果与基本公式计算的完全相同,检验 结果等价。四格表专用公式在应用上更为简便。(? 2 0.05(1)=3.84,自由度为1时,Z与 ? 2关系) 四、 四格表?2 检验的条件Evidence-based Medicine(1)当n≥40 且每格T≥5时,用上述?2 检 验的基本公式或专用公式。 (2)当n≥40 但有1≤ T & 5时,须用?2 检 验校正公式: (3)当n & 40 或有T & 1时,不能应用??2 检验,宜用确切概率法。Evidence-based Medicine确切概率法不是?2 检验,是?2 检验应用上的补 充。 根据各公式的应用条件,应用? 2检验时要注 意n的大小和是否有一格的T&5。可先找出 Tmin格子来判断是否需要校正。――找最小的行合计和列合计,而不是A最小的那个格子的T 也最小。 Evidence-based Medicine例4 将病情相似的淋巴系肿瘤患者随机分成两 组,分别作单纯化疗和复合化疗,两组的 缓解率资料见下表,问两组的缓解率有无 差别? 表6 两组疗法治疗淋巴系肿瘤的缓解率比较治疗效果 组别 缓解 未缓解 合计 缓解率(%)Evidence-based Medicine单纯化疗 复合化疗2(4.80) 14(11.20)10(7.20) 14(16.80)12 2816.7 50.0合计16244040.0 分析步骤:H0:π1= π2 H1:π1≠ π2Evidence-based Medicine? ?2?a ? b ??c ? d ??a ? c ??b ? d ?2? ad ? bc ? n / 2? n2α=0.05?( 2 ? 14 ? 10 ? 14 ? 40 / 2) ? 40 12 ? 28 ? 16 ? 24? 2.624 查?2界值表,Evidence-based Medicine?2 0.05(1)=3.84 本例中, ? 2 =2.624&3.84,P &0.05, 按α=0.05 水准,不拒绝H0 ,差别无统计学意义, 尚不能认为两种疗法的总缓解率有差别 。注意:若不校正, ? 2=3.89,P&0.05,与前相反! 二 行×列表资料的检验一、当多个率或多个构成比比较时,其计 算公式如下:Evidence-based Medicine式中: A:某格的实际数 ni:对应A的行合计数 mj:对应A的列合计数 Evidence-based Medicine例5 为研究某镇痛药的不同剂量镇痛效 果有无差别,研究人员在自愿的原则 下,将条件相似的53名产妇随机分成 三组,分别按三种剂量服用该药,效 果见表7-8,问三种剂量镇痛有效率是 否不同? 镇痛效果 剂量 合计有效1.0mg 3(7.36) 11 12 26无效12 9 6 27 15 20 18 53有效率 (%) 20.00 55.00 66.67 49.06Evidence-based Medicine2.5mg 5.0mg 合计 Evidence-based Medicine1、建立假设,确定α水准 H0:三种剂量镇痛总有效率相同。 H1:三种剂量镇痛总有效率不全相同。 2、求统计量 3、确定P值,作出结论Evidence-based Medicine根据自由度查 =5.99界值表,查得?2 0.05(2)本例 ?2 =7.58&5.99, p&0.05, 在所 定检验水准上,拒绝H0, 可认为三种剂量 镇痛有效率不同。 Evidence-based Medicine二、行×列表 检验应注意的问题: 1、不能有一格T&1; 若有需用确切概率计算法。 2、1≤T≤5的格子数不能超过1/5。 如果不能满足以上条件,处理方法有三种: ⑴增大样本例数,使理论数增大; ⑵删去理论数太小的行或列; ⑶将理论数太小的行或列与相邻的性质相近的行或 列合并(注意合理性),使理论数增大。 3、单向有序行列表(等级资料),用秩和检验。 Evidence-based Medicine4、若检验后,得出P?α,拒绝 H0只能 说明各总体率不同或不全相同。而不 能说任两组都有差别,若要具体说明 哪两组有差别,还需再做两两比较。 表7剂量某药不同剂量的镇痛效果镇痛效果 合计 有效 无效 12 15 有效率 (%) 20.00Evidence-based Medicine1.0mg3(7.36)2.5mg5.0mg 合计1112 2696 272018 5355.0066.67 49.06 表8 不同剂量有效概率间的两两比较对比组 四格表?2 P值 ?=0.05水准上有无统 计学意义-* --1.0mg―2.5mg4.38 7.19 0.540.036 0.007 0.463Evidence-based Medicine1.0mg―5.0mg 2.5mg―5.0mg三组两两比较,共3次,校正检验水准: ?’= 2?/k(k-1) =0.1/6=0.017 Evidence-based Medicine三、行×列表的 分割法(补) 分割的方法与原则: 1、先将原行×列表中相差最小的两率分割出来, 进行四格表的 检验;若无统计学意义将其合 并,再与另一相差小的率比较,直至结束. 2、分割后的 值之和应十分接近原行×列表 的 值. 3、分割后的 自由度之和,应等于原行×列表的 自由度。 后两条可以验正分割是否合理、计算是否正确 例6 某省观察三个地区的黄曲霉毒素 污染的情况,问三个地区花生的黄曲 霉毒素污染率有无差别?Evidence-based Medicine 如表所示: 某省三个地区花生的黄曲霉毒素污染率地区 检测数 29 44 污染数 23 14 未污染数 6 30 污染率(%) 79.3 31.8Evidence-based Medicine甲 乙丙113827.3经 检验, 个地区的污染率不同。 本例:Tmin=5.238&5可认为三 分割计算表地区 污染数 未污染 合计 污染率 (%) ν p乙143308441131.80.09 1 &0.05 27.3Evidence-based Medicine丙合计173855乙 +丙 甲 合计17 23 4038 6 4455 29 8430.9 17.83 79.3 17.92 2 1 &0.05 样本率与总体率比较:π偏0.5较远:直接计算概率。 np与n(1-p)>5,u;Evidence-based Medicine计 数 资 料配对设计分类资料:配对四格表资料的χ2检验: 两样本率比较:四格表资料χ2(4个公式的条件) 四格表有理论数<1或n<40:确切概率法 多个样本率或构成比比较:行×列表资料χ2(条件) 多个样本率或构成比间两两比较: χ2分割 统计方法的选择的方法一看资料类型、二看设计分组、三 看样本大小和分布。Evidence-based Medicine例7. 某医生比较甲、乙两药降血脂 的疗效,各 70 人、 60 人,结果如何分析?例 8. A 、 B 、 C 三地区抽样某疫苗 接种率是80%、95%、82%,问三地区的接 种率是否不同? 第五节 循证医学常用的描述指标Evidence-based Medicine统计分析主要包括统计描述(statistical description)与统计推断(statistical inference)两大内容,因此,其统计指 标也可分为描述性指标和统计推断指标。 Evidence-based Medicine(一)描述性指标 描述性分析主要是使用统计指标、统计 图表对数据资料所进行的最基本的统计 分析。 描述性分析可使研究者和读者能准确、 全面地了解数据资料所包涵的信息,也 有利于在此基础上完成资料的进一步统 计分析。 Evidence-based Medicine Evidence-based Medicine1、EER 循证医学中预防和治疗性试验中,将发生率可 细分为 EER和CER两类。 EER (experimental event rate),即试 验组的某事件发生率。常用于临床对某病采用 某些防治措施后该疾病的发生率,如阿斯匹林 治疗心肌梗死实例试验组的病死率为: EER=a/n1= 15/125=0.12,即12% Evidence-based Medicine2、CER CER (control event rate),即对照 组的某事件发生率,常用于临床对某病 不采取防治措施或采用阳性对照措施的 发生率,如前阿斯匹林治疗心肌梗死实 例的对照组病死率为: CER=c/n2= 30/120=0.25,即 25% Evidence-based Medicine在两平行组的临床试验中,还经常需要 比较两组某个指标是否有差异,常用两 组该指标的差值或比值来反映两组试验 效应的差异。 Evidence-based Medicine3、RD 两个发生率的差即为率差,也称危险差 (rate difference,risk difference, RD),如,试验组发生 率( EER)与对照组发生率(CER)的 差,其大小可反映试验组发生率比对照 组多或少的绝对量。其计算公式如下: RD=EER-CER Evidence-based MedicineRD的意义 当RD=0时,可认为试验组的发组别死 亡未死亡合计生率与对照组的发生率相 同。 当RD>0时,可认为试验组的发生率大 于对照组(T&C) 。 当RD<0时,可认为试验组的发生率小 于对照组(T&C) 。 Evidence-based Medicine RR ?EER a/(a ? b) ? CER c/(c ? d)Evidence-based Medicine4、RR 试验组的发生率为:EER=a/(a+b) 对照组的发生率为:CER=c/(c+d) 两个率的比值按下式计算:EER a/(a ? b) RR ? ? CER c/(c ? d) Evidence-based Medicine该两个率的比值叫做相对危险度 (relative risk, RR),是前瞻性研究 中较常用的指标, 它是试验组某事件发生率(EER)与对照 组(或低暴露)的发生率(CER)之比, 用于说明试验组的发生率是后者的多少 倍。 Evidence-based MedicineRR的意义 当RR=1时,可认为试验组的发生率与 对照组的发生率相同; 当RR>1时,可认为试验组的发生率大 于对照组(T&C) ; 当RR<1时,可认为试验组的发生率小 于对照组(T&C) . Evidence-based Medicine该例,试验组的病死率是对照组的0.48倍,即RR&1,该实例试验组的病死率低 于对照组。 Evidence-based Medicine5 、OR 在回顾性研究 (如病例对照研究 )中,往 往无法得到某事件的发生率 CER或 EER(如死亡率、病死率、发病率 ),也 就无法计算出RR。但是,可以计算出一 个 RR的近似值,该近似值称为 OR, 即是比值比(odds ratio)。 Evidence-based Medicine Evidence-based MedicineOR的计算(1) 病例组的暴露与未暴露的比值: odds1=a/b 对照组的暴露与未暴露的比值 odds0=c/d Evidence-based MedicineOR的计算(2) 试验组的比值 (odds1)与对照组 (odds0)的比值之比即为比值比、比数 比、机会比、优势比)其计算公式为: Evidence-based MedicineOR的意义 当OR=1时,可认为病例组的比值与对 照组的比值相同 当OR>1时,可认为病例组的比值大于 对照组(odds1&odds0) 当OR<1时,可认为病例组的比值小于 对照组(odds1&odds0) Evidence-based Medicine实例 某研究者为研究心肌梗死与近期使用某 口服避孕药间的关系,调查了234心肌 梗死病人和1742名未发生心肌梗死的对 照者,回顾性调查了所有研究对象近期 是否使用某口服避孕药,其调查结果见 后表 Evidence-based Medicine该实例的比值比:该实例的比值比: Evidence-based Medicine该回顾性研究结果表明,病例组近期使 用口服避孕药的比值是对照组比值的 1.68倍,据此研究结果提示患者心肌梗 死与近期使用某口服避孕药可能有一定 关系。 Evidence-based Medicine前瞻性研究中的OR 在前瞻性研究中,如果某事件的发生率 很低时(如P≤5%),可以使用OR来近 似计算(估计)RR,且发生率越低其近似 结果越好。 Evidence-based Medicine Evidence-based MedicineOR的应用及意义 在回顾性研究(病例对照研究)中,由 于无法计算发病率、死亡率等率的指标, 也就无法计算RR,只能使用OR 。 而在前瞻性研究中,当所研究疾病的发 病率、病死率等发生率较低时,即a和c 均较小时,OR与RR的计算结果非常近 似,此时也可使用OR估计RR。 Evidence-based Medicine(二)常用指标的可信区间 在临床研究中,不仅要用描述性指标, 还经常需要比较不同组别的某指标的差 别是否有统计学意义,以反映试验效应。 此时,需要使用如卡方检验、t检验和方 差分析等假设检验(hypothesis test) 的方法。 Evidence-based Medicine除了假设检验方法,还可以使用可信区 间(confidence interval,CI)的方 法,达到比较不同组别间描述性指标有 无差异的目的。假设检验与可信区间同 属统计推断的范畴。 Evidence-based Medicine在循证医学中常用两组某指标差值或比 值的可信区间,以此得出某指标的差值 或比值有无统计学意义的结论。 通常,试验组与对照组某指标差值或比 值的95%可信区间与α为0.05的假设检 验等价,99%的CI与α为0.01的假设 检验等价。 Evidence-based Medicine1. RD的CI 两率差的可信区间由下式计算: (EER-CER)±uα SE(RD) 即:RD±uα SE(RD) RD的95%的可信区间为 RD±1.96×SE(RD) Evidence-based Medicine实例RD的标准误 阿斯匹林治疗心肌梗死的效果EER= 15/125 =12%,CER =30/120 =25%,两率差的标准误: Evidence-based Medicine实例RD的CI 该试验两率差(RD)的可信区间为: (EER-CER)±1.96×SE(RD) =(0.12-0.25)±1.96×0.049= -0.23~0.03 该例两率差的可信区间为-0.23~-0.03,上 下限均小于0(不包含0),两率有差别。可 认为阿斯匹林可降低心肌梗死的病死率。 Evidence-based Medicine Evidence-based Medicine2.RR的可信区间 RR的可信区间,应采用自然对数进行 计算,即应求RR的自然对数值ln(RR)和 ln(RR)的标准误SE (lnRR),其RR的 95%可信区间为: exp[ ln(RR) ±1.96×SE(lnRR) ] Evidence-based Medicine Evidence-based Medicine Evidence-based Medicine实例RR的CI RR的95%可信区间为: exp[ ln(RR) ±1.96 SE(lnRR) ] = exp( -0.734 ± 1.96×0.289) = (0.272,0.846) 该例RR的95%可信区间为0.272~ 0.846 Evidence-based MedicineRR实例分析结论 使用阿斯匹林治疗的病人与对照组相比, 其病死率的RR为0.48,其RR的95% 可信区间为0.272~0.846。 故可认为阿斯匹林治疗组的病死率小于 对照组,可认为阿斯匹林治疗心肌梗死 有效。 Evidence-based Medicine3 .OR的可信区间 ln(OR)的可信区间为: ln(OR) ± uα SE(lnOR) OR的95%可信区间为: exp[ ln(OR) ±1.96×SE(lnOR) ] Evidence-based MedicineOR的标准误 OR的可信区间同样需要采用自然对数计 算,其ln(OR)的标准误SE (lnOR)按 下式计算: Evidence-based Medicine Evidence-based Medicine实例OR及CI计算 以前述阿斯匹林治疗心肌梗死为例 ln(OR)=ln(0.409)=-0.894 SE(lnOR) =0.347 其OR95%的CI为: exp[ ln(OR) ±1.96×SE(lnOR) ] = exp(-0.894±1.96×0.347) = (0.207,0.807) Evidence-based Medicine实例OR的结论 阿斯匹林治疗心肌梗死的OR为0.409, 其OR的95%可信区间为0.207~ 0.807,阿斯匹林治疗组的病死比值小 于对照组,可以认为使用阿斯匹林治疗 心肌梗死有效。 Evidence-based Medicine Evidence-based Medicine(三)防治效果指标 防治效果指标应用前提 通常临床试验要求: (1)试验组-某治疗措施,对照组-安慰剂 (2)主要疗效指标:使用如病死率、复 发率等负性指标 (3)目的:试验组使用某治疗措施后, 这些事件的发生率是否低于对照组 Evidence-based Medicine6.ARR 当率差(RD)是某疗效事件的发生率的差 值(如病死率的差值),且EER&CER时, 即为绝对危险度减少率(absolute risk reduction,ARR) ARR可用于度量试验组使用某干预措 施后,某疗效事件的发生率比对照组减少 的绝对量:ARR=|EER-CER| ARR的可信区间计算与RD相同 Evidence-based Medicine Evidence-based MedicineARR 实例的CI 该试验ARR的可信区间为: |EER-CER|±1.96×SE(RD) =|0.12-0.25|±1.96×0.049= 0.03~ 0.23 该例ARR的可信区间为0.03~0.23, 上下限均不包含0,两率有差别。可认为 阿斯匹林可降低心肌梗死的病死率。 Evidence-based Medicine7.NNT及可信区间 NNT(the number needed to treat) 的临床含义为:对病人采用某种防治措施, 比对照组多得到一例有利结果需要防治的 病例数(the number of patients whoneed to be treated to achieve one additional favorable outcome,NNT)。 Evidence-based MedicineNNT的计算及意义 NNT的其计算公式为: NNT=1/|EER-CER| =1/ARR 该公式中的EER和CER定义为采用某干 预措施之后,某疗效事件的发生率,如 阿斯匹林预防心肌梗死的病死率。 因此,NNT的值越小,表示该防治效果 就越好,其临床意义也就越大. Evidence-based MedicineNNT的可信区间 NNT= 1/ARR,故NNT的95%的可信区 间的计算可利用ARR的95%的可信区间来 计算。 NNT95%CI的下限: 1/(ARR的上限值) NNT95%CI的上限: 1/(ARR的下限值) Evidence-based Medicine注意:NNT中的对照组通常是安慰剂对 照,如果对照组是阳性对照,则不同阳 性对照组的多个NNT间不能比较,如: CER EER ARR NNT 0.7(a) 0.4(b) 0.3 3.3 0.6(a) 0.4 (c) 0.2 5.0 0.5(a) 0.4(d) 0.1 10 Evidence-based MedicineARR95%的CI为: 0.13±1.96×0.049= 0.03~0.23 NNT95%CI的下限1/0.23=4.35 NNT95%CI的上限1/0.03=33.33 Evidence-based Medicine8.RRR RRR为相对危险度减少率(relative risk reduction),其计算公式为: RRR=|CER-EER| /CER = 1-RR 当EER&CER时,RRR反映了试验组某 事件的发生率比对照组减少的相对量。 但是,该指标无法衡量发生率减少的绝 对量。 Evidence-based Medicine注意:RRR无法衡量发生率减少的绝对量 如:试验人群中某病的发生率EER=39%, 而对照组人群的发生率CER=50%, RRR=|CER-EER| /CER =|50%-39%| /50% = 22% 但是,若在另一研究中,试验组的疾病发生率 为0.39/10万,对照组的疾病发生率为 0.50/10万,其RRR仍为22% Evidence-based MedicineRRR的CI 如前例阿斯匹林预防心肌梗死的RR=0.48,其 95%的可信区间为:0.272~0.846 RRR= 1-RR=1-0.48=0.52 RRR= |CER- EER|/CER =0.13/0.25=0.52 RRR的CI可由1-RR计算得到 如前例RRR95%的CI为:0.154~0.728 Evidence-based Medicine(四)不利结果指标 不利结果指标应用前提 通常临床试验要求: (1)试验组:某治疗措施;对照组:安慰剂 (2)不利结果或不良事件指标:如肝功能异常 率、肾功能异常率等指标 (3)目的:试验组使用某治疗措施后,某不利 结果(不良事件)的发生率是否大于对照组 Evidence-based Medicine9.ARI 当率差(RD)是某不良事件发生率的差值 (如肝功能异常率) ,且EER&CER时, 即为绝对危险度增加率(absolute risk increase,ARI) ARI可用于度量试验组使用某试验因素 后,其不利结果的发生率比对照组增加 的绝对量: ARI=|EER-CER| ARI的可信区间计算与RD相同 Evidence-based Medicine10.NNH NNH的临床含义为:对病人采用某种防 治措施,比对照组多出现一例不利结果 需要治疗的病例数(the number needed to harm one more patients from the therapy, NNH)。 Evidence-based MedicineNNH的计算及意义 NNH的计算式为: NNH =1/|EER-CER|=1/ARI 该公式中的EER和CER定义为采用某干 预措施之后,某不利结果的发生率。因 此,NNH的值越小,表示该某治疗措施 引起的不利结果(不良事件或副反应)就 越大。 Evidence-based Medicine注意:NNH中的对照组通常是安慰剂对 照,如果对照组是阳性对照,则不同阳 性对照组的多个NNH间不能比较,如: CER EER ARR NNT 0.7(a) 0.4(b) 0.3 3.3 0.6(c) 0.4 (d) 0.2 5.0 0.5(e) 0.4(f) 0.1 10 Evidence-based Medicine11.RRI RRI为相对危险度增加率(relative risk increase,RRI ),其计算公式 为: RRI=|EER-CER| /CER 当EER&CER时,RRI反映了试验组某 事件的发生率比对照组增加的相对量。 但其可信区间的计算与RRR相同。 Evidence-based Medicine本章重点: 定量资料和定性资料统计描述常用的指 标有哪些? 循证医学常用的描述指标EER、CER、 RR、OR、RD的含义? 循证医学常用的描述防治效果指标有哪 些?
1、统计指标和标志的区别与联系――区别:标志反映的是总体单位的属性和特 征,有能用数量表示的数量标志,还有不能用数量表示的品质标志。而指标 反映的是总体数量...试卷分析常用统计指标_教育学_高等教育_教育专区。试卷分析常用统计数据一、平均分 平均分是反映学生成绩集中趋势最主要的测量指标, 一般在 Excel 中可快捷 求得。...生产统计指标计算。煤炭生产统计有关指标计算办法摘编 现将《煤炭工业计划统计常用指标计算办法》(1989年版)有关生产统计指标的相关规定和计算办法摘编,供生产统计人员...主要统计指标解释及计算公... 3页 免费 医院统计讲义 15页 免费如要投诉违规内容,请到百度文库投诉中心;如要提出功能问题或意见建议,请点击此处进行反馈。 ...主要统计指标简介一、国内(地区)生产总值 一、基本定义 国内(地区)生产总值,简称 GDP,是一个国家(或地区)在一定时期内 所生产的全部最终产品和服务的价值总和,...2014 年劳动工资统计指标解释一、从业人员及工资总额统计原则 ?法人单位从业人员:谁发工资谁统计; ?劳务派遣人员:由实际用工单位统计,即谁使用谁统计,无论用工...主要统计指标解释及计算公式一、卫生资源 1.卫生机构:指从卫生行政部门取得《医疗机构执业许可证》,或从民政和工商行政、机 构编制管理部门取得法人单位登记证书,为...财务统计指标解释和说明_经管营销_专业资料。指标解释和说明 资产总计 指企业拥有或控制的能以货币计量的经济资源,包括各种财产、债权和其他权利。资产按其流动性(即...中华财险报表系统项目 & 财险统计指标定义 & 作 者: 保存日期: 保存日期: 交付日期: 交付日期: 交付签字: 交付签字: 文档修改记录文档状态 二稿 最后修改日期 ...发电成本分析 39页 免费 第4章 电力统计指标 53页 免费如要投诉违规内容,请到百度文库投诉中心;如要提出功能问题或意见建议,请点击此处进行反馈。 ...
All rights reserved Powered by
copyright &copyright 。文档资料库内容来自网络,如有侵犯请联系客服。

我要回帖

更多关于 jmeter 偏离指标 的文章

 

随机推荐