詳細解釋
流形(Manifold)是高維空間中的低維結構,是理解嵌入向量 (嵌入 / 詞嵌入 / 向量嵌入) (Embedding Lookup)和數據分布的重要數學概念。
直觀理解:
- 高維空間中的低維「曲面」
- 如二維紙在三維空間中的摺疊
- 數據通常分佈在流形上而非充滿全空間
流形假設:
- 真實高維數據往往有低維結構
- 圖像、文本都位於某個流形上
- 生成模型學習流形結構
應用:
- 降維:t-SNE、UMAP保持流形結構
- 生成模型:在流形上採樣
- 插值:流形上兩點間的平滑路徑
- 異常檢測:遠離流形的為異常
與嵌入向量 (嵌入 / 詞嵌入 / 向量嵌入) (Embedding Lookup)的關係:
- 好的嵌入將數據展平到低維流形
- 相似數據在流形上相近
- 語義運算對應流形上的操作
流形學習:
- 保持局部結構的降維
- Isomap、LLE等算法
- 深度學習自動學習流形表示
是理解高維數據和表示學習的數學基礎。