文章预览
工欲善其事必先利其器 Trinity Trinity是由Broad 研究所和希伯来大学联合开发的一种利用RNA-seq数据进行高效、稳健地从头组装转录本的方法,包含三个独立的软件模块: Inchworm (虫)(C++) 将 reads切为 k-mers (k bp长度的短片段) 利用Overlap关系对k-mers进行延伸 (贪婪算法) 输出所有的序列 (“contigs”) Chrysalis (蛹)(C++) 聚类所有相似区域大于k-1bp的 contigs 构图 (区分不同的 “components”) 将reads比对回 components,进行验证 Butterfly (蝶)(Java) 拆分graph 为线性序列 使用reads以及 pairs关系消除错误序列 Trinity组装依据的算法是de Bruijn Graph,即从打断的文库中提取一定长度的K-mer,然后根据k-1错位相似的方法拼接组装的可能路径,最终确定完整的参考组装转录组。 Trinity示意图 主要编程语言:Perl GItHub:https://github.com/trinityrnaseq/trinityrnaseq 文档:https://github.com/trin
………………………………