匹配和随机分组在控制混杂混杂性偏倚的控制方法作用上有何异同

随机区组设计与完全随机设计有什么区别?
能以心理学的实验研究为例来说明吗?
首先,随机区组设计与完全随机设计是两种不同思想的设计。完全随机设计为单因素设计,仅考虑处理因素。随机区组设计为双因素设计,考虑的因素有两个,一个是处理因素,一个是区组因素。由于通过区组来控制可能的非处理因素或者混杂因素,且在进行方差分析时将区组变异从总的变异中分解出来,则当确实存在区组效应时,由于从误差项分离了区组变异,使方差分析过程中减少了非处理因素或混杂因素引起的偏倚变异,减少了误差而提高了检验效率。其次,随机区组设计与完全随机设计的分组方式不同。随机区组设计是先将控制因素条件相同或相似的受试对象安排在同一区组,然后将其随机的分配到各处理组,同一区组的受试对象数和处理组数相等。这样,各处理组间均衡性较好。完全随机设计是将受试对象完全随机的分配到各处理组,虽然理论上可以使各组趋于均衡,但在样本含量较小时,各组常常出现不均衡的现象。采用随机区组则能保持均衡。非心理学专业,举不出例子,凑合看吧。无越狱iPhone手打。。。求摸摸。。
随机区组能排除被试内差异中的误差值,算法在张厚璨心理统计279~280页。完全随机:完全随机分班,最后考试成绩即实验结果。区组随机:根据成绩分出成绩水平类似的平行班,最后考试成绩即实验结果。
补充一下 无论是完全随机设计还是随机区组设计 都包括单因素设计和多因素设计
完全随机设计的方差分析与随机区组方差分析之间最大的区别是,后者能够分离出区组效应,就是能将被试之间性质不同导致产生的差异分离出来
对植物来说:完全随机:是将受试对象×重复数看成一个整体。如A、B、C,重复两次,为:A、A、B、B、C、C,将这六个元素放在一起随机排列就是完全随机设计。随机区组:根据情况,将元素(血缘、性别等)或将土地(如:肥力、地利等)分组,组内随机配列。如:3个元素根据土地情况分成4组(=4个重复):A B CC B AA B CC A B
随机区组设计资料中区组选择的原则在于区组间差别越大越好,区组内差别越小越好。 在自变量水平上,随机区组设计资料包括处理因素和区组因素,而完全随机设计仅包括处理因素,因此可以认为随机区组设计资料检验效能高于完全随机设计的方差分析。当然作为区组变量,应当从设计上考虑与实验因素不存在交互作用,如果不能肯定是否存在交互作用,则应当采用析因设计、正交设计等更加复杂的统计模型。
已有帐号?
无法登录?
社交帐号登录常见偏倚及其控制(Biases and Their Control)
第一节 研究结果的变异性
1、研究结果的变异性(Variability)数据(指标)的变动或波动。它可存在于不同水平,包括个体水平,群体水平和样本(研究)水平。
2、变异性的来源:⑴生物学(真实)变异和测量变异:物学变异反映真实的客观变异,测量变异反映测量过程的误差。⑵随机变异和系统变异:随机变异(误差)的绝对值和方向(符号)交错变化,并呈有界范围的正态分布。系统变异(误差)的绝对值和方向保持恒定。测量误差分为随机误差和系统误差。
3变异的水平:⑴个体水平的变异性:指某个体特征测量值的变化,它可以是个体真值随时间的改变,也可以是由
于测量误差引起的变化
⑵群体水平的变异性:可以看成是各个体的累计变异,因为构成群体的各个体具有不同的遗传素质
并受到不同的环境影响。群体的变异程度常常大于个体的变异。也受到测量
误差的影响。
⑶样本水平的变异性:指通过不同样本的研究所得结果的差异性。
研究的真实性
研究真实性或效度(Validity)指研究收集的数据、分析结果和所得结论与客观实际的符合程度。
研究误差是研究真实性的反面。 研究误差的两种常见类型:随机误差(random error)
系统误差 (systematic error)
随机误差(random error):指随机抽样所得统计量与总体参数的差异
? 由抽样(机遇)所致,通常与测量过程及其它变量的影响无关,无方向性
? 可通过统计学方法估计和评价
? 是不可避免的,但通过合理的设计、正确的抽样(加大样本量等)可使之减小
系统误差 (systematic error)
? 随机误差以外的误差,任何研究都有发生的可能
在流行病学调查研究中系统误差又叫偏倚(bias)
可以通过严格的设计、实施、分析来尽可能地控制
? 重复试验及增加样本含量并不能减小系统误差
研究的可靠性或信度(reliability)亦称精确度(precision),就是反映研究结果中随机误差大小的程度,随机误差小则研究信度高。
二、内部真实性
内部真实性internal validity指研究结果与实际研究对象真实情况的符合程度,它回答一个研究本身是否真实或有效。
改善措施:限制研究对象的类型和研究的环境条件。
三、外部真实性
外部真实性(external validity)研究结果与推论对象真实情况的符合程度,又称为普遍性(generalizability)。它回答一个研究能否推广应用到研究对象以外的人群。
改善措施:增加研究对象的异质性,使得研究对象的代表性范围扩大。如:多中心临床试验的开展
研究的偏倚
1946年,Berkson做最著名的偏倚研究并给予证实,又称为Berkson偏倚。 选择偏倚
1976年,Miettinen详细讨论了偏倚的定义,并给出分类框架,
一、选择偏倚(selection bias)
㈠定义:研究对象的选取过程中,由于选取方式不当,导致入选对象与未入选对象之间存在系统差异,由此造成的偏倚称为选择偏倚。例如研究对象采用志愿者,方便样本,或者研究对象的无应答或失访等。
㈡常见的种类:
1、入院率偏倚(admission rate bias)也叫Berkson偏倚,当利用医院病人作为病例和对照时,由于各种疾病的入院率不同导致病例组与对照组某些特征上的系统差异而导致的系统误差
? 常见于以医院为基础的病例对照研究、临床防治试验、预后判断等。
2、现患病例―新病例偏倚(prevalence-incidence bias)也称奈曼偏倚(Neyman’s bias)在病例对照研究或现况研究中,用于研究的病例一般是现患病例或存活病例,由于形成的病例样本与单纯由新病例构成的样本暴露特点等不同,致使调查结果出现的系统误差
在病例对照和现况研究中产生此偏倚的原因:⑴用于研究的病例一般是研究时的存活者- 现患病例(暴露特点和死亡病例不同)⑵某些病人在患病后,可能会改变其原来某些因素的暴露状况
3、检出征候偏倚
( detection signal
bias)在疾病和暴露之外存在一个征候因素,即一种临床症状或体征;这种症状或体征不是疾病的危险因素,但人们因具有这种征候去就诊,从而提高了早期病例的检出率;致使过高地估计了暴露程度,因而发生了系统误差,最终可能得出该征候因素与该疾病有联系的错误结论
4、无应答偏倚和志愿者偏倚 (non-respondent and volunteer bias):无应答者是指研究对象中那些因为各种原因不能回答调查研究工作所提出的问题的人。一项研究工作中的无应答者可能在某些重要特征或暴露上与应答者不同,由此产生的偏倚称为无应答偏倚。常见于现况研究和队列研究。
大学生健康状况调查
志愿者偏倚是与无应答偏倚相对的情况
5、时间效应偏倚:
㈢选择偏倚控制方法
1、建立健全的健康信息系统(health information system,HIS)
2、采用严格的科学的研究设计,了解整个研究中可能出现的选择偏倚
? 严格掌握研究对象纳入排除标准
? 取得研究对象合作,减少无应答、失访
? 病例对照研究中尽量选择新诊断的病人作研究对象;用医院病人作研究对象时,尽量采用多种对照
二、信息偏倚(information bias)
㈠定 义 又称测量偏倚(measurement bias)或观察偏倚(observation bias),是来自于测量或资料收集方法的问题,使得获取的资料存在系统误差。由于流行病学的暴露或疾病多为分类测量,所以信息偏倚又可称为错误分类(错分)偏倚(misclassification bias)。
表现为研究对象的特征被错误分类
由于所收集的有关暴露或疾病的信息不准确或不完整,造成对研究对象的归类错误
差异错分(differential misclassification)分类组间存在差异的偏向可能不同,所以造成高估或低估研究效应值
无差异错分(non-differential misclassification)暴露或疾病的错误分类同研究分组无关,各比较组间不存在差异;
在多数情况下模糊了研究组的差异,一般使研的效应值偏低(OR趋向1)
㈡差异性信息偏倚的两种常见类型
回忆偏倚(recall bias)产生于研究对象记忆过去活动和暴露能力的差异。不可避免
调查者偏倚(interviewer bias)产生于调查者对研究对象有差异性地收集信息。采取盲法,可以降低调查者偏倚。 ㈢信息偏倚的控制:
①明确资料收集方法和严格质量控制②尽可能采用“盲法”收集资料③尽量收集客观指标的资料
铅暴露 ④采用调查技巧避免回忆偏倚⑤严格的调查设计和研究人员的科学态度⑥调查之前应开展预调查
三、混杂偏倚(confounding bias)
㈠定义 是指暴露因素与疾病发生的相关(关联)程度受到其他因素的歪曲或干扰。
混杂的本来含义是“混合掺杂”( mixing together ),这里是指暴露因素对疾病的独立效应与混杂因素的效应混在一起,造成对暴露因素效应的估计偏差。
㈡混杂因素的判断条件:必须同时具备以下三个条件:
①必须是所研究疾病的独立危险因素
②必须与所研究的暴露因素存在统计学联系
以上是判断可疑混杂因素的两项基本条件
③不应是暴露因素与疾病因果链中的一个环节或中间变量(否定或排除条件)(饮酒-肝硬化-肝癌)
㈢混杂偏倚引起的假关联
Ⅰ继发关联(secondary association)是一种纯粹由混杂偏倚产生的关联。即怀疑的病因(暴露)E与疾病D并不存在因果关系,而是由于两者(E,D)有共同的原因C,E,D同C存在关联,从而继发产生E与D的关联。
Ⅱ直接因果关联的歪曲:如果怀疑的病因(暴露)E与疾病D既存在直接关联,又存在间接关联或与其他危险(保护)因素F存在相关,E与D的总关联等于E-D直接关联同E-F-D间接关联之和。如果直接关联与间接关联混在一起,而将其作为直接关联的估计,就会出现混杂偏倚。
㈣判定原则 :比较混杂因素调控前后的暴露因素效应估计值,如果存在专业上有意义的差异(注意不是统计学的显著性差异),就产生了混杂偏倚。
㈤混杂偏倚的控制
设计阶段:采用随机化(randomization)、限制(restriction)进入或匹配(matching)
分析阶段:采用分层分析、标准化率分析、多变量分析
四、混杂偏倚的分层分析
M-H(Mantel-Haenszel)分层分析方法的步骤
对可能的混杂因素进行分层
判定层间RR或OR是否相等或相近
得到控制混杂后的调整RR或
再将调整RR或OR与分层前的粗RR或粗OR(cRR或cOR)进行比较
五、混杂偏倚与其它偏倚(选择及信息偏倚)的异同
相同:是一种系统误差,不能通过增大样本量来控制
①后两种偏倚主要都限于样本内,即人群中实际无此误差。
②而混杂偏倚不止是样本的问题。首先是某第三因子在目标人群中同所研究的结果变量存在固有的联系。 ③一般偏倚(选择及信息偏倚)是一种错误,所造成的误差是我们不愿看到的,因此应尽量避免。
④对混杂偏倚来说,它告戒我们在下结论时应特别谨慎,但同时它在认识整个病因网的过程中起了一定的作用。因为混杂因子往往正是某个结果变量的危险因子,应尽量去发现。
⑤有时受科学知识的限制,在设计和分析阶段未对其作适当的处理,结论仍会有第三因子、第四因子的混杂。【图文】混杂偏倚判别实例预防_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
混杂偏倚判别实例预防
上传于||暂无简介
大小:213.50KB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢关注今日:9 | 主题:87187
微信扫一扫
扫一扫,下载丁香园 App
即送15丁当
混杂因素控制问题,请高手帮忙回答!
页码直达:
这个帖子发布于10年零343天前,其中的信息可能已发生改变或有所发展。
混杂因素条件:1是危险因素
2不是中间变量
3相关的两个危险因素才能互为混杂因素。请问多因素分析可以控制混杂因素吗?既然互为混杂因素的变量之间存在相关(共线),我看多因素分析是无法控制混杂因素的。以上推论可否,请高手指点!
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
是问题太简单了吗?怎么没人理我?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
控制混杂的方法有:限制、配比、多因素分析和分层分析当自变量较多时用多因素分析较好。楼上战友提的共线性问题在多因素分析时确实存在,控制办法是先做共线性诊断,指标无共线性时方可用多因素分析;若存在共线性先用因子分析,然后再进行多因素分析
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
huxiaoyun 控制混杂的方法有:限制、配比、多因素分析和分层分析当自变量较多时用多因素分析较好。楼上战友提的共线性问题在多因素分析时确实存在,控制办法是先做共线性诊断,指标无共线性时方可用多因素分析;若存在共线性先用因子分析,然后再进行多因素分析同意,提得好;那么统计学上讲的混杂因素与流行病学上讲的混杂因素从概念上应该有所区分,统计学上的定义偏宽,而流行病学上定义偏窄(共线的)对吗?烦请指点?另外:做半数致死量有哪几种方法?Logistic回归分析可以吗?若可以对资料有什么要求?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
hongweitang 你好,你所说的“统计学上讲的混杂因素与流行病学上讲的混杂因素从概念上应该有所区分” 我不太理解。统计学上好像只有系统误差和随机误差两个概念,系统误差就是流行病书上的三种偏倚(选择、信息和混杂),统计学方法主要作用是辨别某事件的结果是否是由随机误差造成的。而不能用统计学方法控制系统误差,系统误差应在实验设计和进行中予以控制。但是混杂可以用统计学方法弥补,就是上述的控制混杂的方法。半数致死量可以用加权直线回归法,Logistic回归分析也可以。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
huxiaoyun 您好,那么我们就再深入交流一下流行病和卫生统计学上混杂因素的控制问题:统计书上讲:&多因素模型可以控制混杂和交互作用&,我认为流行病学上讲的互为混杂因素的两个因素(以2个为例)用多因素模型很难控制,因为他们有共线性,这样就不能求出其纯粹单个因素的作用,如身高、体重,本身是一对共线的变量,他们是多因素分析难以分开的“死结”;因子分析、主成分分析,身高和体重也都作为同类因子或主成分被提取,还是不能将其分开;这种情况我个人认为要想纯粹控制这种混杂因子,最好做分层分析!我是流行病专业的,数学和数理统计基础薄弱,经常会被一些应用统计问题所困扰。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
hongweitang 您好,分层分析是分析混杂因素较为经典的方法,但是它要求样本量大和自变量少,我也是流行病专业的,现在正在写论文,对上述问题深有体会,特别是各层样本量少时,分层分析的结果甚是惊人!你所说得身高体重两变量共线性问题,我个人认为有两种方法:一是你所说得分层分析,但要求样本量大,自变量少。如果自变量较多分层分析不适用可用办法2。就是先用用主成分分析因子分析找出公因子后对该因子进行样品聚类,然后跟其他变量一起引入Logistic回归模型,得到主效应模型。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
hongweitang 同意,提得好;那么统计学上讲的混杂因素与流行病学上讲的混杂因素从概念上应该有所区分,统计学上的定义偏宽,而流行病学上定义偏窄(共线的)对吗?烦请指点?另外:做半数致死量有哪几种方法?Logistic回归分析可以吗?若可以对资料有什么要求?半数致死量计算软件LD50 1.01来自http://www.bio-soft.net/data.html
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
hongqi77 edited on
路过看看,很受教
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
我认为当自变量较多时,实际上只能用多因素分析。共线性问题做共线性诊断是可以的,还要参考一下自变量对应变量的影响等,考虑是否为混杂因子,再考虑是否进行多因素分析
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
最近研究了一下这个问题:如果某两个因素是混杂因素的话 那么在做Logistic回归后是可以自行将其中一个排除,或者通过调整他们的回归系数得到一个整合的,Logistic 本身就可以用来处理混杂,这个你无须担心。但是对于共线性的变量,我的理解是,既然他们存在共线性,那么其中一个变量就可以通过另外一个变量去表示,即你可以删除一个专业上认为不重要的因素,或者将两个因素作差,作商或进过某些处理,转变为另外一个因素,在引入方程,但要注意在结果中的解释。有错之处,请各位老师指出,谢谢!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园Logistic回归模型、分层分析法控制混杂偏倚的比较研究--《海峡预防医学杂志》2014年06期
Logistic回归模型、分层分析法控制混杂偏倚的比较研究
【摘要】:目的探讨logistic回归模型、分层分析法(Mantel-Haenszel,M-H法)控制混杂偏倚时的异同点。方法以实例介绍常用统计软件实现logistic回归模型、M-H法,并比较两者的异同。结果 Logistic回归模型输出结果:OR=1.35、95%CI=1.15~1.59,OR=4.97、95%CI=4.18~5.91;M-H法输出结果:齐性检验?2=0.044,P0.05,OR=1.35,95%CI=1.15~1.59。结论两者都是资料分析阶段常用检出和控制混杂偏倚的方法,各有优缺点,应根据不同的目的选用不同方法。
【作者单位】:
【关键词】:
【分类号】:R195.1【正文快照】:
当研究某因素与某种疾病关联时,由于某个既与疾病有关、又与所研究暴露因素有联系的外来因素影响,会掩盖或夸大所研究暴露因素与疾病的联系,这种影响叫混杂,该外来因素叫混杂因素[1,2]。科研数据中经常会涉及混杂及如何控制的问题。控制混杂偏倚常用的方法有限制、匹配、随机
欢迎:、、)
支持CAJ、PDF文件格式,仅支持PDF格式
【相似文献】
中国期刊全文数据库
郭孙伟,张照寰,许世瑾,沈福民;[J];上海第一医学院学报;1985年04期
恽振先;;[J];中国公共卫生;1989年03期
黄文涌;李卫民;;[J];贵阳医学院学报;1990年02期
姜潮;胡克震;刘宗航;乔友林;;[J];中国卫生统计;1993年01期
沈洪兵,徐耀初;[J];中国公共卫生;1991年03期
方积乾;陈和年;;[J];中国卫生统计;1993年04期
刘启军;[J];预防医学情报杂志;2002年05期
方积乾;陈和年;;[J];中国卫生统计;1993年05期
易东,许汝福,夏结来;[J];第三军医大学学报;1994年05期
李康;郭祖超;胡琳;徐勇勇;;[J];中国卫生统计;1992年06期
中国重要会议论文全文数据库
张波;沈其君;;[A];2011年中国卫生统计学年会会议论文集[C];2011年
中国硕士学位论文全文数据库
张志琴;[D];山西医科大学;2006年
杨晓妍;[D];四川大学;2005年
梁洪川;[D];山西医科大学;2006年
张波;[D];宁波大学;2012年
&快捷付款方式
&订购知网充值卡
400-819-9993
《中国学术期刊(光盘版)》电子杂志社有限公司
同方知网数字出版技术股份有限公司
地址:北京清华大学 84-48信箱 大众知识服务
出版物经营许可证 新出发京批字第直0595号
订购热线:400-819-82499
服务热线:010--
在线咨询:
传真:010-
京公网安备75号

我要回帖

更多关于 发表偏倚 的文章

 

随机推荐