主要观点总结
文章介绍了TOSICA模型,一个基于Transformer的多头自关注深度学习模型,用于细胞类型注释。该模型能够利用生物学上可理解的实体实现可解释的细胞类型注释,并提供了对发育和疾病进展过程中细胞行为的生物学见解。文章还涉及模型的训练方式、单细胞图谱网站资源以及安装和使用TOSICA的步骤。
关键观点总结
关键观点1: TOSICA模型简介
TOSICA是一个基于Transformer的多头自关注深度学习模型,用于细胞类型注释。它能够利用生物学上可理解的实体(如通路或调控子)提供可解释的生物学见解。
关键观点2: 模型的应用和优势
TOSICA能够实现快速、准确的一站式注释和对批量不敏感的整合,揭示与疾病进展和严重程度相关的罕见细胞类型、异质性和动态轨迹。它为理解发育和疾病进展过程中的细胞行为提供了生物学见解。
关键观点3: 模型的训练方式和架构
模型根据单细胞RNA测序数据和每个细胞的细胞类型标签进行训练。使用数据库或专家知识,模型使用掩码可学习嵌入将参考输入数据转换为代表每个基因组的标记,并在其中添加类标记。在注意力函数中,查询、关键和值矩阵从基因组和CLS组合标记进行线性投影,并通过兼容函数计算权重(注意力),然后分配给每个值以计算输出。
关键观点4: 单细胞图谱网站资源
文章提到了几个权威的单细胞图谱网站,如Azimuth、HCL Human Cell Landscape、MCA Mouse Cell Atlas等,这些网站提供的图谱数据可以作为训练模型的资源。
关键观点5: 安装和使用TOSICA的步骤
文章详细介绍了如何在linux和jupyter环境下安装和使用TOSICA的步骤,包括创建小环境、安装软件、安装TOSICA、在Jupyter中使用TOSICA环境等。
文章预览
TOSICA是基于 Transformer 的多头自关注深度学习模型 ,它能利用生物学上可理解的实体(如通路或调控子)实现可解释的细胞类型注释。TOSICA 能够实现快速、准确的一站式注释和对批量不敏感的整合,同时为理解发育和疾病进展过程中的细胞行为提供了可解释的生物学见解,揭示了与疾病进展和严重程度相关的罕见细胞类型、异质性和动态轨迹。 ⇲Transformer for one stop interpretable cell type annotation | Nature Communications # 框架 该模型根据单细胞 RNA 测序数据和每个细胞的细胞类型标签进行训练。根据 数据库或专家知识 ,使用掩码可学习嵌入将参考输入数据(n 个基因)转换为代表每个基因组(GS)的 k 个输入标记,并在其中添加类标记(CLS)。 相当于你给ta一个已经注释好的单细胞数据,ta会根据这份数据来训练一个模型用于我们这份输入数据的细胞注释。
………………………………