DRUG AI 今天为大家介绍的是来自Vivien Marx的一篇论文。降维有助于可视化高维数据集。使用这些工具时需要谨慎,并且要调整参数。有时,这些方法需要反复思考。 用肉眼观察数据可以作为数据分析的开始,但在讲座或论文中向他人展示数据的可视化需要更多的努力。为了在大量的遗传和基因组数据中找到并呈现有意义的模式,研究人员可能会求助于一类用于降维的统计和计算工具。随着遗传学领域及其数据集的迅速增长,带有降维算法的数据可视化工具得到了广泛应用,但有些人认为这些工具会扭曲和误导。 主成分分析(PCA)、t分布随机邻居嵌入(t-SNE)和统一流形近似与投影(UMAP)是生命科学家用来进行降维的工具之一。一篇描述降维工具的论文的作者指出,这些工具在理解数据集的几何和邻域结构方面“既可以是福音也可以是诅咒”。在某
………………………………