流形假设

流形假设认为，现实中的很多高维数据集实际上沿着高维空间内的低维潜流形分布。^[1]^[2]^[3]^[4]流形假设的结果是，很多最初看起来需要很多变量描述的数据集，实际上只需要较少变量，这好比底流形的局部坐标系。有人认为，这原理是机器学习算法通过考虑一些共有特征以有效描述高维数据集的基础。

事实速览 流形假设, 科学假说 ...

流形假设与机器学习中非线性降维的有效性有关。流形雕刻、流形对齐、流形正则化等很多降维技术都假设数据位于低维子流形上。

流形假设的主要意义在于

在样本间插值的能力是深度学习泛化的关键。^[5]

统计流形的信息几何