如何用R做一般线性模型和多重比较的matlab做fdr校正正

关注今日:5 | 主题:179633
微信扫一扫
扫一扫,下载丁香园 App
即送15丁当
【求助】关于FDR的问题
页码直达:
这个帖子发布于2年零230天前,其中的信息可能已发生改变或有所发展。
问题已解决悬赏丁当:5
小女子做的是基因多态性的问题,选了一个基因的三个位点,做的病例对照实验,数据以及得到的统计结果如下图审稿人让我做统计校正,推荐了FDR,请问FDR如何计算呢??
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
收起全部有料回复
丁香园中级站友
honorastar
谢谢你的解释,但是你讲的这些我都查到了,说的太专业了,我根本看不懂。有些地方说计算FDR是把未校正的P值从小到大排序,然后最大的P值不变,其他的P值依次乘以系数(位点总数/该P值所在的位次)。那我这个结果就是把9个P值都排序,比如0.04是最小的,校正的P值就是0.04乘以9/1?对, FDR也有多种方法,这所述是一种,比如0.04是最小的,校正的P值就是0.04乘以9/10.045第二小,校正的P值就是0.045乘以9/2;这是 调整BH法
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
anyida05 edited on
两列样本数据的差异基因筛选方法:FoldChange法+FDR控制其中,FDR值的计算方法如下:1)对每个基因进行p-value的计算假设观测到基因A对应的reads数为x,已知在一个大文库中,每个基因的表达量只占所有基因表达量的一小部分,在这种情况下,p(x)的分布服从泊松分布。已知样本一中唯一比对到基因组的总reads数为N1,样本二中唯一比对到基因组的总reads数为N2,样本一中唯一比对到基因A的总reads数为x,样本二中唯一比对到基因A的总reads数为y,则基因A在两样本中表达量相等的概率可由以下公式计算:2)用FDR错误控制法对p-value作多重假设检验校正FDR错误控制法是Benjamini于1995年提出一种方法,通过控制FDR(False Discovery Rate)来决定P值的域值. 假设你挑选了R个差异表达的基因,其中有S个是真正有差异表达的,另外有V个其实是没有差异表达的,是假阳性的。实践中希望错误比例Q=V/R平均而言不能超过某个预先设定的值(比如0.05),在统计学上,这也就等价于控制FDR不能超过5%.对所有候选基因的p值进行从小到大排序,则若想控制fdr不能超过q,则只需找到最大的正整数i,使得 p(i)&= (i*q)/m.然后,挑选对应p(1),p(2),...,p(i)的基因做为差异表达基因,这样就能从统计学上保证fdr不超过q。因此,FDR的计算公式如下:q-value(i)=p(i)*length(p)/rank(p) 参考文献:1.Audic, S. and J. M. Claverie (1997). The significance of digital gene expression profiles. Genome Res 7(10): 986-95.2.Benjamini, Y. and D. Yekutieli (2001). The control of the false discovery rate in multiple testing under dependency. The Annals of Statistics. 29: .
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
FDR概念提出大概十年左右了,现在有些高水平的文章上用到了它,FDR是一个矫正I类错误的方法,计算FDR使用的是一个叫Q-value的软件,下载链接
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
两列样本数据的差异基因筛选方法:FoldChange法+FDR控制其中,FDR值的计算方法如下:1)对每个基因进行p-value的计算假设观测到基因A对应的reads数为x,已知在一个大文库中,每个基因的表达量只占所有基因表达量的一小部分,在这种情况下,p(x)的分布服从泊松分布。已知样本一中唯一比对到基因组的总reads数为N1,样本二中唯一比对到基因组的总reads数为N2,样本一中唯一比对到基因A的总reads数为x,样本二中唯一比对到基因A的总reads数为y,则基因A在两样本中表达量相等的概率可由以下公式计算:2)用FDR错误控制法对p-value作多重假设检验校正FDR错误控制法是Benjamini于1995年提出一种方法,通过控制FDR(False Discovery Rate)来决定P值的域值. 假设你挑选了R个差异表达的基因,其中有S个是真正有差异表达的,另外有V个其实是没有差异表达的,是假阳性的。实践中希望错误比例Q=V/R平均而言不能超过某个预先设定的值(比如0.05),在统计学上,这也就等价于控制FDR不能超过5%.对所有候选基因的p值进行从小到大排序,则若想控制fdr不能超过q,则只需找到最大的正整数i,使得 p(i)&= (i*q)/m.然后,挑选对应p(1),p(2),...,p(i)的基因做为差异表达基因,这样就能从统计学上保证fdr不超过q。因此,FDR的计算公式如下:q-value(i)=p(i)*length(p)/rank(p) 参考文献:1.Audic, S. and J. M. Claverie (1997). The significance of digital gene expression profiles. Genome Res 7(10): 986-95.2.Benjamini, Y. and D. Yekutieli (2001). The control of the false discovery rate in multiple testing under dependency. The Annals of Statistics. 29: .
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
FDR概念提出大概十年左右了,现在有些高水平的文章上用到了它,FDR是一个矫正I类错误的方法,计算FDR使用的是一个叫Q-value的软件,下载链接
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
wangyan888sdo 两列样本数据的差异基因筛选方法:FoldChange法+FDR控制其中,FDR值的计算方法如下:1)对每个基因进行p-value的计算假设观测到基因A对应的reads数为x,已知在一个大文库中,每个基因的表达量只占所有基因表达量的一小部分,在这种情况下,p(x)的分布服从泊松分布。已知样本一中唯一比对到基因组的总reads数为N1,样本二中唯一比对到基因组的总reads数为N2,样本一中唯一比对到基因A的总reads数为x,样本二中唯一比对到基因A的总reads数为y,则基因A在两样本中表达量相等的概率可由以下公式计算:2)用FDR错误控制法对p-value作多重假设检验校正FDR错误控制法是Benjamini于1995年提出一种方法,通过控制FDR(False Discovery Rate)来决定P值的域值. 假设你挑选了R个差异表达的基因,其中有S个是真正有差异表达的,另外有V个其实是没有差异表达的,是假阳性的。实践中希望错误比例Q=V/R平均而言不能超过某个预先设定的值(比如0.05),在统计学上,这也就等价于控制FDR不能超过5%.对所有候选基因的p值进行从小到大排序,则若想控制fdr不能超过q,则只需找到最大的正整数i,使得 p(i)&= (i*q)/m.然后,挑选对应p(1),p(2),...,p(i)的基因做为差异表达基因,这样就能从统计学上保证fdr不超过q。因此,FDR的计算公式如下:q-value(i)=p(i)*length(p)/rank(p) 参考文献:1.Audic, S. and J. M. Claverie (1997). The significance of digital gene expression profiles. Genome Res 7(10): 986-95.2.Benjamini, Y. and D. Yekutieli (2001). The control of the false discovery rate in multiple testing under dependency. The Annals of Statistics. 29: . 谢谢你的解释,但是你讲的这些我都查到了,说的太专业了,我根本看不懂。有些地方说计算FDR是把未校正的P值从小到大排序,然后最大的P值不变,其他的P值依次乘以系数(位点总数/该P值所在的位次)。那我这个结果就是把9个P值都排序,比如0.04是最小的,校正的P值就是0.04乘以9/1?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园中级站友
honorastar
谢谢你的解释,但是你讲的这些我都查到了,说的太专业了,我根本看不懂。有些地方说计算FDR是把未校正的P值从小到大排序,然后最大的P值不变,其他的P值依次乘以系数(位点总数/该P值所在的位次)。那我这个结果就是把9个P值都排序,比如0.04是最小的,校正的P值就是0.04乘以9/1?对, FDR也有多种方法,这所述是一种,比如0.04是最小的,校正的P值就是0.04乘以9/10.045第二小,校正的P值就是0.045乘以9/2;这是 调整BH法
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
anyida05 edited on
anyida05 对, FDR也有多种方法,这所述是一种,比如0.04是最小的,校正的P值就是0.04乘以9/10.045第二小,校正的P值就是0.045乘以9/2;这是 调整BH法 谢谢老师的解答,那我可不可以这样算呢?因为我用的是三个位点,每个位点做三组case-control得到3个P值。把每个位点的三个P值做FDR。比如第二个位点三个P值由小到大依次是0.04,0.11,0.76.那么FDR后的P值就是0.04乘以3/1,0.11乘3/2,0.76不变??其余两个位点也如此计算。可以这样算吗?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园中级站友
honorastar
谢谢老师的解答,那我可不可以这样算呢?因为我用的是三个位点,每个位点做三组case-control得到3个P值。把每个位点的三个P值做FDR。比如第二个位点三个P值由小到大依次是0.04,0.11,0.76.那么FDR后的P值就是0.04乘以3/1,0.11乘3/2,0.76不变??其余两个位点也如此计算。可以这样算吗? 发重,见下。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园中级站友
honorastar
谢谢老师的解答,那我可不可以这样算呢?因为我用的是三个位点,每个位点做三组case-control得到3个P值。把每个位点的三个P值做FDR。比如第二个位点三个P值由小到大依次是0.04,0.11,0.76.那么FDR后的P值就是0.04乘以3/1,0.11乘3/2,0.76不变??其余两个位点也如此计算。可以这样算吗? 不知道你最后 怎么处理的,如果严格来说,3 个位点*每个位点三组case-control=9次比较。这更严格一些。当然,按楼上的思路也是一种方法。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
易侕统计软件自动计算FDR,见: 而且自动对每个SNP做相加模型、显性模型、隐性模型分析。除FDR校正外,用permutation 计算empirical P 值也是一个很有说服力的方法。见随机交换法计算多重比较校正的P值:
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
honorastar
小女子做的是基因多态性的问题,选了一个基因的三个位点,做的病例对照实验,数据以及得到的统计结果如下图
审稿人让我做统计校正,推荐了FDR,请问FDR如何计算呢?? 请问当时你的FDR矫正是怎么做的呀
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园后使用快捷导航没有帐号?
查看: 12550|回复: 10
注册时间阅读权限10最后登录在线时间84 小时贡献值0 积分134分享好友记录日志相册UID19775
正式滴友, 积分 134, 距离下一级还需 366 积分
水晶847 心级134 精华0主题帖子
在进行统计分析时,经常会提到多重比较校正,其中FDR和FWE是常用的两种。请教这两种方法的基本原理及适用条件。
注册时间阅读权限100最后登录在线时间79 小时贡献值0 积分497分享好友记录日志相册UID19644
feedback.windstalker.net
水晶1548 心级497 精华0主题帖子
I don't know anything...
but others know:
Education's purpose is to replace an empty mind with an open one. - Malcolm Forbes
注册时间阅读权限10最后登录在线时间116 小时贡献值0 积分212分享好友记录日志相册UID19205
正式滴友, 积分 212, 距离下一级还需 288 积分
水晶549 心级212 精华0主题帖子
为啥现在好多链接打开都是这个样子?然后还会报毒
注册时间阅读权限10最后登录在线时间116 小时贡献值0 积分212分享好友记录日志相册UID19205
正式滴友, 积分 212, 距离下一级还需 288 积分
水晶549 心级212 精华0主题帖子
注册时间阅读权限10最后登录在线时间61 小时贡献值0 积分142分享好友记录日志相册UID2427
加油呀加油 一定要把这个问题搞
正式滴友, 积分 142, 距离下一级还需 358 积分
水晶351 心级142 精华0主题帖子
FWE校验全称是family wise error,FDR,是false discovery rate,两种方法都可以控制多重校验中犯第一类错误的概率,相比较而言, FWE校验是更为严格的一种校验方式。比如你设定p=0.05,需要你判别是否激活的体元个数是10000个,那么就意味着你要做一万次假设检验,而每一个假设检验犯第一类错误的概率为0.05/10000,而对于FDR校验而言,假如在10000个体元中有1000个体元是激活的,那么这一千次假设检验每一个犯错误的概率为0.05/1000
注册时间阅读权限10最后登录在线时间116 小时贡献值0 积分212分享好友记录日志相册UID19205
正式滴友, 积分 212, 距离下一级还需 288 积分
水晶549 心级212 精华0主题帖子
happysun 发表于
FWE校验全称是family wise error,FDR,是false discovery rate,两种方法都可以控制多重校验中犯第一类错 ...
0.05/1000 这是校验后依然错误的概率吗?
注册时间阅读权限10最后登录在线时间116 小时贡献值0 积分212分享好友记录日志相册UID19205
正式滴友, 积分 212, 距离下一级还需 288 积分
水晶549 心级212 精华0主题帖子
happysun 发表于
FWE校验全称是family wise error,FDR,是false discovery rate,两种方法都可以控制多重校验中犯第一类错 ...
那经过校验的p值应该如何算呢?
注册时间阅读权限10最后登录在线时间61 小时贡献值0 积分142分享好友记录日志相册UID2427
加油呀加油 一定要把这个问题搞
正式滴友, 积分 142, 距离下一级还需 358 积分
水晶351 心级142 精华0主题帖子
chengeng 发表于
0.05/1000 这是校验后依然错误的概率吗?
对每一个假设检验允许犯第一类错误的概率
注册时间阅读权限10最后登录在线时间61 小时贡献值0 积分142分享好友记录日志相册UID2427
加油呀加油 一定要把这个问题搞
正式滴友, 积分 142, 距离下一级还需 358 积分
水晶351 心级142 精华0主题帖子
chengeng 发表于
那经过校验的p值应该如何算呢?
我们一般都选几个典型值 0.05 0.001之类的 告诉别人你设定的多重校验的p值
注册时间阅读权限5最后登录在线时间7 小时贡献值0 积分45分享好友记录日志相册UID37307
新滴友, 积分 45, 距离下一级还需 35 积分
水晶119 心级45 精华0主题帖子
请参考我的新贴;
2011二季度优秀版主
Medal No.1
Medal No.1
Powered by
Template By
Comsenz Inc.多个样本率的多重比较__百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
多个样本率的多重比较_
上传于||文档简介
&&多​个​样​本​率​的​多​重​比​较
阅读已结束,如果下载本文需要使用0下载券
想免费下载更多文档?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩4页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢方差分析与多重比较_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
方差分析与多重比较
上传于||文档简介
&&方​差​分​析​方​法
阅读已结束,如果下载本文需要使用1下载券
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩41页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢

我要回帖

更多关于 matlab fdr校正 的文章

 

随机推荐