今天看啥  ›  专栏  ›  测序中国

Cell | 中山大学联合阿里云团队利用AI揭秘隐藏的RNA病毒“圈”

测序中国  · 公众号  · 医学 科技自媒体  · 2024-11-02 15:48
    

主要观点总结

本文主要介绍了一种新的深度学习算法LucaProt,它能够准确检测RNA依赖性RNA聚合酶(RdRP)序列,并揭示了大量的潜在RNA病毒物种和病毒超群。该研究提升了领域内对RNA病毒多样性和病毒演化历史的认知。研究采用了多种策略揭示并交叉验证了潜在的病毒RdRPs,并通过基准测试验证了LucaProt的敏感性和特异性。此外,该研究还涉及到RNA病毒的生态结构和全球分布等方面的内容。

关键观点总结

关键观点1: 新开发的深度学习算法LucaProt集成了序列和预测结构信息,能够准确检测RNA依赖性RNA聚合酶(RdRP)序列。

该算法共确定了161979种潜在RNA病毒物种和180个RNA病毒超群,大幅提升了领域内对RNA病毒多样性和病毒演化历史的认知。

关键观点2: 研究团队使用相同的数据集和RdRP数据库进行基准测试,结果显示LucaProt在敏感性和特异性方面均优于其他四种病毒发现工具。

在查全率、精确度和长序列处理方面,LucaProt也表现出优势。

关键观点3: 研究鉴定了假定RNA病毒基因组的组成和结构,并揭示了全球RNA病毒的生态结构。

该研究还涉及到病毒超群的基因组特征以及不同生态系统亚型中RNA病毒多样性等方面的内容。


文章预览

RNA病毒是一类将遗传信息存储在RNA分子中的病毒,在生活中无处不在,且与人类健康密切相关,例如常见的流感病毒、新冠病毒等。截至目前,人类已经明确鉴定的病毒种类约为5000,这仅为“病毒圈”的很小一部分,主要是因为传统RNA病毒鉴定方法高度依赖与已知病毒序列的同源性比对。因此,那些缺乏同源性或同源性极低的病毒很难被发现,进而导致新病毒发现的效率较低。 近年来,人工智能(AI)相关方法,特别是深度学习算法,凭借更高的准确性、更优越的性能、对其他工具更少的依赖、灵活的模型架构等,正在对生命科学的多个领域产生重大影响。虽然已有CHEER、VirHunter、Virtifier和RNN-VirSeeker等深度学习方法能够从基因组和宏基因组数据中识别病毒,但这些方法只关注核苷酸序列本身,忽视了蛋白质序列或结构信息,从而限制了它们识别高 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览