主要观点总结
本文介绍了浙江大学良渚实验室沈宁/刘志红课题组开发的基于Transformer架构的多模态深度学习模型SpliceTransformer(简称SpTransformer),用于预测pre-mRNA序列中的组织特异性可变剪接位点。该模型可应用于解析组织特异性剪接变异相关的疾病,为疾病相关遗传变异提供基于可变剪接机制的全新见解。
关键观点总结
关键观点1: 研究背景
RNA可变剪接是基因转录后的一种重要调控机制,也是生物体多样性和蛋白质多功能性的重要来源之一。人类约90%以上的基因存在可变剪接,不同组织与细胞类型中可变剪接的多元性促进了细胞表型的多样性。现有的研究亟需开发能够精准预测组织特异性可变剪接的算法工具。
关键观点2: 研究目的
开发一个精准地预测具有组织特异性的可变剪接的算法工具SpTransformer,并通过大量真实突变数据验证其在遗传诊断中的能力。
关键观点3: 研究方法
基于Transformer架构开发SpTransformer模型,使用GTEx人体组织RNA-seq数据和额外的哺乳动物RNA-seq数据训练,使用one-hot编码的pre-mRNA序列作为输入,通过卷积编码器和Transformer网络预测组织特异性剪接变化。
关键观点4: 研究结果
SpTransformer模型性能优于其他已有算法,可预测组织特异性剪接,并通过可视化分析发现远端序列调控元件对可变剪接的影响。模型还成功应用于预测单核苷酸突变对组织特异性剪接的影响,并在大规模数据分析中识别可能影响组织特异性剪接的突变及其富集的基因。
关键观点5: 研究意义
SpTransformer具有重要的临床价值和研究意义,为理解疾病背后的遗传因素提供了除基因表达水平以外的视角。进一步地,基于组织特异性的可变剪接分析有望成为解析复杂疾病遗传机制的关键方法之一。
文章预览
导 读 RNA可变剪接(Alternative splicing)是基因转录后一种重要的调控机制,也是生物体多样性和蛋白质多功能性的重要来源之一。人类约90%以上的基因存在可变剪接,不同组织与细胞类型中可变剪接的多元性促进了细胞表型的多样性。同时,引起RNA可变剪接的变异也与人类多种遗传疾病相关。 值得注意的是,RNA可变剪接具有组织特异性,相同的pre-mRNA序列能以组织特异性的形式发生可变剪接,从而产生多样性的转录组和蛋白质组表达。然而,现有算法无法预测组织特异性的可变剪接,因此亟需开发能够精准预测组织特异性可变剪接的算法工具,加深我们对于遗传变异的解读及后续研究。 近日,浙江大学良渚实验室 沈宁/刘志红 课题组在 Nature Communications 上发表了题为“SpliceTransformer predicts tissue-specific splicing linked to human diseases ” 的研究论文, 开发
………………………………