两组配对样本差异基因分析量差异较大,怎么进行基因差异表达分析

差异分析 | 生信菜鸟团RNA-seq数据差异表达分析方法的比较 - 生物信息 - 生物秀
标题: RNA-seq数据差异表达分析方法的比较
摘要: [RNA-seq数据差异表达分析方法的比较]BMC Bioinformatics
doi:10 05-14-91
A comparison of methods for differential expression analysis of
RNA-seq data
Charlotte Soneson (Charlotte Soneson@isb-sib ch)
Mauro Delorenzi (Mauro …… [本文关键词:差异表达 样本量 差异表达基因 阈值 RNA-seq]……
BMC Bioinformatics
doi:10.05-14-91
A comparison of methods for differential expression analysis of RNA-seq data
Charlotte Soneson (Charlotte.Soneson@isb-sib.ch) Mauro Delorenzi (Mauro.Delorenzi@unil.ch)
这是今年年初新发的一篇方法学文章,是我感兴趣的,但不太让人激动。
摘要说的背景是:
&发现条件间差异表达的基因是理解表型变异的分子基础的一个有机部分。过去几十年中,DNA微阵列被广泛用于定量不同基因的mRNA丰度,更近期的RNA-seq作为一个强有力的竞争者冒了出来。随着测序成本持续下降,可以想象使用RNA-seq做差异表达分析会迅速增加。为了探索可能性和解决这种相对新型的数据提出的挑战,大量软件包特别为RNA-seq数据的差异表达分析开发出来了。&
而本文的结果是:
&我们广泛比较了RNA-seq数据的差异表达分析的7种方法。所有方法都可以在R框架下免费获得,并以一个计数矩阵作为输入,计数即每个样品中映射到每个感兴趣的基因组特征上的reads数目。我们基于模拟数据和实际RNA-seq数据评价了这些方法。&
结论就是:
&极小样本量仍是RNA-seq实验的普遍状况,对所有评价方法造成了困难;而任何在这样的条件下获得的结果都应该谨慎解释。对于更大的样本量,组合稳定方差变换和limma方法来进行差异表达分析会在很多不同的条件下表现良好,正如非参数的SAMseq方法一样。&
到2013年还说这种话,这些结论实在有点鸡肋啊~ 貌似为SAMseq摇旗呐喊来的&&不过:
比较了11种软件包,这还是前所未有的:DESeq、edgeR、NBPSeq、TSPM、baySeq、EBSeq、NOISeq、SAMseq、ShrinkSeq这9种可直接处理计数数据,另两种分别是voom(+limma)和vst(+limma),转换数据后用limma做差异表达分析。
正如很多文章已经提到的那些,RNA-seq比起微阵列有三大优点:
1、更大的动态范围
2、更低的背景噪音
3、能检测和定量先前未知的转录本及亚型
RNA-seq也有一些难题:
1、样本内不均匀性:基因组区域之间核苷酸组成的变异性导致沿基因组的read覆盖深度并不均匀;
2、同样表达水平下,长基因比短基因有更多的reads;
3、对于条件之间的表达差异,分别对各个基因进行差异表达分析,而忽略了样本内的偏倚(它们被假设对所有样本有类似的影响)
4、样本间不均匀性:测序深度或文库大小
5、少数高表达基因抑制了其他基因的read计数比例,可能导致低表达基因的差异表达假阳性
相应的解决办法是:
相关热词:
..........
生物秀是目前国内最具影响力的生物医药门户网站之一,致力于IT技术和BT的跨界融合以及生物医药领域前沿技术和成功商业模式的传播。为生物医药领域研究人员和企业提供最具价值的行业资讯、专业技术、学术交流平台、会议会展、电子商务和求职招聘等一站式服务。
官方微信号:shengwuxiu
电话:021-拒绝访问 |
| 百度云加速
请打开cookies.
此网站 () 的管理员禁止了您的访问。原因是您的访问包含了非浏览器特征(3a5d7ef0a188436a-ua98).
重新安装浏览器,或使用别的浏览器温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!&&|&&
LOFTER精选
网易考拉推荐
用微信&&“扫一扫”
将文章分享到朋友圈。
用易信&&“扫一扫”
将文章分享到朋友圈。
&&&&&&&& 以2kb大小的窗口分割基因组,窗口之间有1kb的重叠,计算窗口内的甲基化碱基个数和C碱基总个数。
&&&&&&&& 方法一是利用R[3]中的Fisher精确检验判断两个个体的同一个窗口的甲基化水平是否显著不同,例如个体一某窗口中甲基化碱基个数为7,C碱基总个数为15,,个体二中该窗口甲基化甲基个数为13,C碱基总个数为17,命令如下
&&&&&&&& #!/usr/bin/env Rscript
&&&&&&&& x=c(7,13,15,17)
&&&&&&&& info&-matrix(x,nrow=2)
&&&&&&&& fisher.test(info,alternative=”two.side”)
&&&&&&&& 方法二是先做出两个个体的甲基化差异分布图,即统计窗口的甲基化比例的差异分布,如下图中所示,然后计算均值以及标准差,设定阈值,选取甲基化百分比差别在均值数倍方差之外的窗口作为甲基化差异区域。
& & & & &&
2.两组样品及多组样品
&&&&&& 根据参考文献[4]中所采用的方法,对多组多个个体的甲基化差异区域进行检测的主要流程为:
所有的检验都是基于R[3]的,首先介绍一下各个检验。
Bartlett检验,检验样本数据的方差是否齐次,我们认为p-value&0.05则方差齐次,否则样本不满足方差齐次,命令如下。
#!/usr/bin/env Rscript
x=c(7,13,15,17)&&&&&&&&&&&&&&&& #四个数值
g=c(rep(1,2),rep(2,2)&&&&&& #前两个一组,后两个一组
Bartlett.test(x~g)
Student’s t检验:当两组样本的方差齐次时,可采用该检验判断是否显著差别,设定p-value的阈值,当检验的结果中p-value低于阈值时,我们认为两个样本具有显著差别,否则差别不显著。
#!/usr/bin/env Rscript
x=c(7,13,15,17)
y=c(4,6,7,5,7,85)
t.test(x,y)
Wilcoxon rank-sum检验也称Mann-Whitney U检验,是当两组样本的方差不齐次时,可采用该检验判断是否显著差别,类似于T检验,设定p-value的阈值,当检验的结果中p-value低于阈值时,我们认为两个样本具有显著差别,否则差别不显著。
#!/usr/bin/env Rscript
x=c(7,13,15,17)
y=c(4,6,7,5,7,85)
Wilcox.test(jetter(x),jetter(y))
ANOVA(方差分析):当具有多组样品时,且样本方差齐次时,可以采用方差分析来判断是多组样品之间否存在显著不同。同时可以利用Tukey事后检验来判断具体是哪一对或者哪几对之间存在着显著差别。本例中除5-2,5-4比较显著不同外,其他组均没有较大差别。
#!/usr/bin/env Rscript
x=c(25.6,22.8,28.0,29.8,24.4,30.0,29.0,27.5,25.0,27.7,23.0,32.2,28.8,28.0,31.5,25.9,20.6,21.2,22.0,21.2)
g=c(rep(1,5),rep(2,5),rep(3,5),rep(4,5),rep(5,5)
f=as.factor(g)
your.avo=aov(x~f)
summary(your.aov)
TukeyHSD(your.aov)
Kruskal-Wallis检验:当多组样品的方差不齐次时,不能使用方差分析来判断样品之间是否存在差别,此时应该用Kruskal-Wallis检验,并用成对T检验来判断具体是哪一对或者哪几对之间存在着显著差别。
#!/usr/bin/env Rscript
x=c(25.6,22.8,28.0,29.8,24.4,30.0,29.0,27.5,25.0,27.7,23.0,32.2,28.8,28.0,31.5,25.9,20.6,21.2,22.0,21.2)
g=c(rep(1,5),rep(2,5),rep(3,5),rep(4,5),rep(5,5)
f=as.factor(g)
kruskal.test(x~f)
pairwise.t.test(x,f,p.adj=”holm”)
&&&&&& 有了这些R命令,在perl的帮助下,就可以实现全基因组的搜索,查询差异甲基化位点了。差异表达基因的搜索类似,只不过指标变成了表达量而不是窗口的甲基化百分比,方法类似。 仅仅是个人的摸索,里面还有一些问题,希望读者也能指正
[1] Li Y, Zhu J, Tian G, Li N, Li Q, et al. (2010) The DNA Methylome of Human Peripheral Blood Mononuclear Cells. PLoS Biol 8(11): e1000533. doi:10.1371/journal.pbio.1000533
[2] Louise Laurent et al. Dynamic changes in the human methylome during differentiation. February 4, 2010, doi:10.1101/gr.Genome Res.&2010.
[3] http://www.r-project.org/
et al. An atlas of DNA methylomes in porcine adipose and muscle tissues. Nature Communications doi:10.1038/ncomms1854, 22 May 2012
阅读(1822)|
用微信&&“扫一扫”
将文章分享到朋友圈。
用易信&&“扫一扫”
将文章分享到朋友圈。
历史上的今天
在LOFTER的更多文章
loftPermalink:'',
id:'fks_',
blogTitle:'差异分析--差异表达基因,差异甲基化区域',
blogAbstract:'生物信息的分析最喜欢的就是找差异,这里我介绍差异分析的主要流程:基于第二代高通量测序的差异甲基化分析。
按照样品个数的不同,可以将分析分为三大类:
blogTag:'',
blogUrl:'blog/static/',
isPublished:1,
istop:false,
modifyTime:5,
publishTime:8,
permalink:'blog/static/',
commentCount:2,
mainCommentCount:1,
recommendCount:0,
bsrk:-100,
publisherId:0,
recomBlogHome:false,
currentRecomBlog:false,
attachmentsFileIds:[],
groupInfo:{},
friendstatus:'none',
followstatus:'unFollow',
pubSucc:'',
visitorProvince:'',
visitorCity:'',
visitorNewUser:false,
postAddInfo:{},
mset:'000',
remindgoodnightblog:false,
isBlackVisitor:false,
isShowYodaoAd:false,
hostIntro:'',
hmcon:'0',
selfRecomBlogCount:'0',
lofter_single:''
{list a as x}
{if x.moveFrom=='wap'}
{elseif x.moveFrom=='iphone'}
{elseif x.moveFrom=='android'}
{elseif x.moveFrom=='mobile'}
${a.selfIntro|escape}{if great260}${suplement}{/if}
{list a as x}
推荐过这篇日志的人:
{list a as x}
{if !!b&&b.length>0}
他们还推荐了:
{list b as y}
转载记录:
{list d as x}
{list a as x}
{list a as x}
{list a as x}
{list a as x}
{if x_index>4}{break}{/if}
${fn2(x.publishTime,'yyyy-MM-dd HH:mm:ss')}
{list a as x}
{if !!(blogDetail.preBlogPermalink)}
{if !!(blogDetail.nextBlogPermalink)}
{list a as x}
{if defined('newslist')&&newslist.length>0}
{list newslist as x}
{if x_index>7}{break}{/if}
{list a as x}
{var first_option =}
{list x.voteDetailList as voteToOption}
{if voteToOption==1}
{if first_option==false},{/if}&&“${b[voteToOption_index]}”&&
{if (x.role!="-1") },“我是${c[x.role]}”&&{/if}
&&&&&&&&${fn1(x.voteTime)}
{if x.userName==''}{/if}
网易公司版权所有&&
{list x.l as y}
{if defined('wl')}
{list wl as x}{/list}扫二维码下载作业帮
拍照搜题,秒出答案,一键查看所有搜题记录
下载作业帮安装包
扫二维码下载作业帮
拍照搜题,秒出答案,一键查看所有搜题记录
两组基因差异表达数据(一组对照一组暴露)无生物学重复.用什么统计方法分析?单因素方差分析可以吗?
扫二维码下载作业帮
拍照搜题,秒出答案,一键查看所有搜题记录
肯定不是单因素方差分析,要考虑T检验,不是独T 就是配对样本T检验,在追问握把 你具体的对照和暴露是什么意思 是测量前后还是有相关关系还是相互之间没有影响
为您推荐:
其他类似问题
扫描下载二维码

我要回帖

更多关于 检验两个样本有无差异 的文章

 

随机推荐