文章预览
非负矩阵分解(Non-negative Matrix Factorization, NMF)是一种降维技术,广泛用于分析非负数据(如基因表达数据)。在单细胞RNA测序(scRNA-seq)数据分析中,NMF可以用于聚类、特征提取或可视化。 一. NMF简介 1. NMF的原理: NMF试图将一个非负矩阵 A 分解为两个非负矩阵W 和 H 的乘积: A:原始数据矩阵(例如,基因表达矩阵,形状为 n×mn \times mn×m,其中 nnn 是基因数,mmm 是细胞数)。 W:特征矩阵(基因的“基因表达模式”),形状为 n×kn \times kn×k。 H:系数矩阵(细胞的“模式权重”),形状为 k×mk \times mk×m。 K:降维后的特征数。 目标 是通过优化使得W 和H 的乘积尽可能逼近A,常用的优化目标函数包括: 最小化重构误差 (通常使用 Frobenius 范数)。 KL 散度 。 2. NMF的优点包括: 保持非负性:NMF在分解过程中保留了非负性约束,因此更适合解释像基
………………………………