文章预览
Intrinsic dimensionality estimation using normalizing flows 使用归一化流估计内在维度 https://proceedings.neurips.cc/paper_files/paper/2022/file/4f918fa3a7c38b2d9b8b484bcc433334-Paper-Conference.pdf 摘要 一个由M个样本组成的数据集嵌入在 空间中有多少自由度?这个数字,正式称为内在维度,可以使用最近邻统计来估计。然而,最近邻统计在大数据集上无法扩展,因为它们的复杂度随着M的增加呈二次方增长,即 。此外,基于最近邻统计的方法在处理嵌入在高维空间中的数据集时表现不佳,尤其是当 时。在本文中,我们提出了一种新的方法来估计内在维度,即使用归一化流(Normalizing Flows),这种方法可以扩展到大型数据集和高维空间。该方法基于一些简单的信封背面计算,预测当用不同噪声幅度扩展数据集时,流的雅可比矩阵的奇异值会如何变化。与法线方向相关的奇异值与切线方
………………………………