专栏名称: 生命科学前沿
以病毒学为特色,探讨生命科学前沿,普及生命科学知识。生命科学之家!
今天看啥  ›  专栏  ›  生命科学前沿

文献分享|如何使用深度学习加速启动子定向进化?

生命科学前沿  · 公众号  · 科技创业 科技自媒体  · 2024-08-30 09:15
    

主要观点总结

本文介绍了来自清华大学的Stephen S.-T. Yau(丘成栋教授)课题组在Briefings in Bioinformatics上发表的论文CAPE: a deep learning framework with Chaos-Attention net for Promoter Evolution。该论文提出了一种名为混沌注意力网络(CAPE)的新方法,用于指导启动子定向进化。该方法通过融合混沌游戏表示全面提取启动子中的进化信息,并使用DenseNet和Transformer结构处理输入信息,取得了显著成效。

关键观点总结

关键观点1: 文章主要内容和背景思路

文章介绍了一种名为CAPE的深度学习模型,用于指导启动子定向进化。传统方法寻找高表达强度的启动子通常耗时且成本高昂,而CAPE模型通过预测模型来指导定向进化,可以显著降低实验成本。文章还介绍了高强度启动子在生物工程和合成生物学应用中的重要性。

关键观点2: 模型框架与特征提取

CAPE模型的特征提取分为两条路径,其中一条路径采用了融合混沌游戏表示的方法,将启动子序列转换为矩阵数据,以提取进化信息。该方法通过两条路径提取的信息输入到深度学习网络Transformer和DenseNet中,训练后用于处理下游任务。

关键观点3: 融合混沌游戏表示的优势

融合混沌游戏表示是一种新的特征提取方法,它利用序列的保守性等进化信息从矩阵中显现。该方法适用于启动子的特殊性,能够解决相似度不高的序列在构建PSSM和MSA时的困难。

关键观点4: 模型效果与实验验证

CAPE模型在两个不同数据集中达到了最佳效果。通过五倍交叉验证和大肠杆菌启动子的生物实验验证,证明该模型能够有效预测启动子强度并用于指导定向进化。此外,作者还实现了迁移学习,以提高模型对其他下游任务的适应性。

关键观点5: 网站服务与实际应用

为了方便生物学家使用CAPE模型进行启动子优化,作者建立了网站http://www.cape-promoter.com。用户可以通过该网站输入关键参数,利用模型进行启动子优化。


文章预览

摘要 今天为大家介绍来自清华大学的Stephen S.-T. Yau(丘成栋教授) 课题组发表于 Briefings in Bioinformatics 的论文CAPE: a deep learning framework with Chaos-Attention net for Promoter Evolution。文章链接:https://academic.oup.com/bib/article/25/5/bbae398/7730134 这篇文章构建了一种用于指导启动子定向进化的深度学习模型。传统的启动子工程中,通过实验方法寻找高表达强度的启动子通常十分耗时且成本高昂,而通过预测模型来指导定向进化可以显著降低实验成本。尽管此前的研究在这一领域取得了一些成果,但由于忽视了进化信息,效果仍然不够理想。本文提出了一种名为混沌注意力网络(CAPE)的新方法,通过融合混沌游戏(Merged Chaos Game Representation)表示全面提取启动子中的进化信息,并使用DenseNet和Transformer结构处理输入信息,其Github链接为https://github.com/BobYHY/CAPE。这一方法在 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览