专栏名称: 生信媛
生信媛,从1人分享,到8人同行。坚持分享生信入门方法与课程,持续记录生信相关的分析pipeline, python和R在生物信息学中的利用。内容涵盖服务器使用、基因组转录组分析以及群体遗传。
目录
相关文章推荐
BioArt  ·  Cell ... ·  18 小时前  
BioArt  ·  Nature | ... ·  2 天前  
今天看啥  ›  专栏  ›  生信媛

常见的数据格式及数据库The learning notes of the biostar handbook(4)

生信媛  · 公众号  · 生物  · 2017-11-12 19:38
    

文章预览

常见的数据格式 genbank genbank是美国国立卫生研究院维护的基因序列数据库,汇集并注释了所有公开的核酸以及蛋白质序列。每个记录代表了一个单独的、连续、带有注释的DNA或RNA片段。 文中关于埃博拉病毒的例子 特点: 易读性,便于信息交换 不利于计算机进行数据分析 可通过RefSeq进行格式转化 FASTA格式 在生物信息学中,FASTA格式是一种用于记录核酸序列或肽序列的文本格式,其中的核酸或氨基酸均以单个字母编码呈现。该格式同时还允许在序列之前定义名称和编写注释。这一格式最初由FASTA软件包定义,但现今已是生物信息学领域的一项标准。(来源维基) 格式 FASTA格式中的一条完整序列,包含开头的单行描述行和多行序列数据。描述行行首前置半角大于号 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览