文章预览
PCA是降维的一种方法。用PCA进行分组,可以针对分组比较明显的个体,根据PCA的结果进行分组。 很多软件可以分析PCA,这里介绍一下使用plink软件和R语言,进行PCA分析,并且使用ggplot2绘制2D和3D的PCA图。 这里,介绍使用亲缘关系分解PCA的方法,原理上来说,A矩阵,G矩阵,H矩阵都可以进行PCA分析并可视化。详见我之前的博客介绍A矩阵与聚类分析( 如何利用系谱进行家系划分并可视化? ) 绘制后的图如下: 2-D PCA图: 图片解释,将每个品种用不同的颜色表示,同时绘制置信区间圆圈,X坐标是PC1,解释24.9%的变异,Y坐标是PC2,解释10.61%的变异。可以看到,三个品种在PCA图里面分的比较开,C品种的有两个A和B的点,应该是异常数据。 3-D PCA图: 图片解释,将每个品种用不同的颜色表示,X坐标是PC1,解释24.9%的变异,Y坐标是PC2,解释10.61%的变异,Z坐
………………………………