詳細解釋
降維(Dimensionality Reduction)是將高維數據映射到低維空間的技術,減少特徵數量,去除噪聲,發現潛在結構,便於可視化和計算。
線性方法:
- PCA(主成分分析):
- 尋找最大方差方向
- 正交變換
- 無監督
- LDA(線性判別分析):
- 最大化類間分離
- 有監督
- SVD(奇異值分解):
- 矩陣分解基礎
- 廣泛應用
非線性方法:
- t-SNE:
- 保持局部結構
- 可視化首選
- 計算昂貴
- UMAP:
- t-SNE的更快替代
- 保持全局和局部結構
- 自編碼器:
- 神經網絡降維
- 非線性變換
- 深度學習方法
應用:
- 可視化:高維數據2D/3D展示
- 去噪:去除噪聲維度
- 壓縮:存儲和傳輸
- 加速:減少計算量
- 特徵提取:學習表徵
選擇考量:
- 線性vs非線性
- 全局vs局部結構
- 計算效率
- 可解釋性
降維是探索性數據分析和預處理的重要工具。