RNA-seq比对组装与定量软件现状(转载)


又是一篇转载,最近在学相关知识     RNA测序并不能直接使用DNA测序常用的BWA、Bowtie等比对软件,这是由于真核生物内含子的存在,导致测到的reads并不与基因组序列完全一致(如下图所示),因此需要使用Tophat/HISAT/STAR等专门为RNA测序设计的软件进行比对。 基因组比对: Tophat2:可以说是最被公认的RNA测序比对软件(实际上是在DNA比对软件Bowtie的基础上做了一个壳),相信很多做RNA测序的同学都是看着Tophat发表在Nature Protocol上的步骤一步步入门RNA测序的; HISAT2:Tophat2的非正式升级版本(因为据说还会有Tophat3),在Tophat的算法基础了上做了大量的改进,而且克服了Tophat最大的缺点——速度慢,Nature Protocol上同样发表了操作流程; STAR:ENCODE计划御用比对软件,权威程度可以与Tophat平起平坐,并且比对速度极快; MapSplice:TCGA使用的比对软件,我自己没用过; RSEM:RSEM更像一个软件包而不是一个比对软件,能够提供从比对到计算差异表达的所有步骤,由于不需要自己写代码串联不同软件生成的数据格式,因此用起来比较省时省力,值得注意的是,TCGA使用MapSplice比对后再用RSEM计算表达量,并没有直接只用RSEM原装的Bowtie的比对结果。 转录组比对:这类型的软件我用的不多,最近尝试过Nature Methods上面发表的Salmon,能从Clean reads直接算到表达量,优点是,快,非常快。然而这个软件连BAM文件都没生成,虽然只是定量的话BAM文件的确没什么用就是了… ———————————————— 比对软件(RNA-SEQ比对到参考基因组上):bowtie2  tophat hista2 star  不需要比对(伪比对,基于建立好的参考转录组):sailfish kallsto salmon 组装与定量:stringtie  cufflink   RSEM    性能比较: tophat与Hista2算法相似,但是tophat已经不再维护,且比对速度方面,Hista2 显著高于 tophat。STAR与Hista2类似。 Ballgown在差异分析方面比cuffdiff更高的特异性及准确性,且时间消耗不到cuffdiff的千分之一 Bowtie2+eXpress做质量控制优于tophat2+cufflinks和bowtie2+RSEM   stringtie 性能显著高于cufflink     常见使用组合: tophat + cufflink (淘汰)  推荐 hista2 + stringtie +ballgown 单细胞转录组推荐用STAR STAR通过检测更大的已知基因标记子集,显示出相似或更好的细胞类型注释结果。但是,与Kallisto相比,STAR比对的准确性和基因丰度的提高带来了显着降低的计算时间(4倍)和更多的内存(7.7倍)的代价。 STAR+RSEM也可  

相关