专栏名称: 生信媛
生信媛,从1人分享,到8人同行。坚持分享生信入门方法与课程,持续记录生信相关的分析pipeline, python和R在生物信息学中的利用。内容涵盖服务器使用、基因组转录组分析以及群体遗传。
今天看啥  ›  专栏  ›  生信媛

来呀,互相伤害呀

生信媛  · 公众号  · 生物  · 2018-03-12 06:00
    

文章预览

理想条件下,我们希望一个物种有多少染色体,结果最好就只有多少个contig。当然对于二代测序而言,这绝对属于妄想,只希望得到的contig文件中,每个contig都能足够的长,能够有一个完整的基因结构,归纳一下就是3C原则: 连续性(Contiguity): 得到的contig要足够的长 正确性(Correctness): 组装的contig错误率要低 完整性(Completeness):尽可能包含整个原始序列 这三条原则也比较定性,我们需要更加定量的数值衡量,比如说contig数, 组装的总长度等, N50等。问题来了,什么叫做N50呢, 小故事,当初我刚学生信的时候,老板给我一个项目,让我继续组装一个初步组装的contigs。我刚入门啥都不懂,于是就去请教一个师兄,他当时问我你的基因组N50是多少呀?我一脸懵逼,茫然四 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览