文章预览
Graph与LLM对齐专题 || ProtST:蛋白质序列和生物医学文本的多模态学习, ICML 2023 基本信息 题目 :ProtST: Multi-Modality Learning of Protein Sequences and Biomedical Texts 作者 :Minghao Xu, Xinyu Yuan, Santiago Miret, Jian Tang 英语题目 :ProtST: Multi-Modality Learning of Protein Sequences and Biomedical Texts 论文链接 :Proceedings of the 40th International Conference on Machine Learning, https://proceedings.mlr.press/v202/xu23t.html 代码链接 :GitHub Repository, https://github.com/DeepGraphLearning/ProtST 论文内容 研究背景 蛋白质语言模型(PLMs)主要基于蛋白质序列来学习蛋白质表示,能够很好地捕捉协同进化信息,但它们无法明确获取蛋白质功能,而获取蛋白质功能是蛋白质表示学习的最终目标。对于许多蛋白质而言,它们的文本属性描述是可用的,其中也描述了它们的各种功能。基于这一事实, 作者构建了ProtDescribe数据集
………………………………