文章预览
生命的基本指令编码在生物体的DNA序列中,分析这些指令可以更深入地了解生物学过程,并能以新的方式将生物学重新编程为有用的技术。 然而,即使是最简单的微生物基因组也非常复杂,数百万个DNA碱基对编码DNA、RNA和蛋白质的相互作用(分子生物学中心法则),也是细胞功能的关键要素。 这种复杂性存在于从单分子到整个基因组的多个维度。 人工智能(AI)的快速发展催生了大语言模型,在对大量数据进行训练时,这些模型表现出越来越先进的多任务推理和生成能力。 但这些模型架构的技术局限性限制了其以类似的规模应用于生物学。 当前的方法难以在单碱基水平上分析序列,并且只能解释和预测相对较短的 DNA 片段。 在大型基因组序列中实现单核苷酸分辨率的先进模型,有可能提取出自然进化变异模式中嵌入的复杂分子相互作用的功能信
………………………………