詳細解釋
高斯分布(Gaussian Distribution),又稱正態分布(Normal Distribution),是統計學和機器學習中最基礎且最重要的概率分布之一。它由德國數學家卡爾·弗里德里希·高斯(Carl Friedrich Gauss)提出,因此得名。
高斯分布的特徵:
- 鐘形曲線(Bell Curve):呈對稱的鐘形,均值處最高
- 68-95-99.7 法則:約68%數據落在均值±1標準差內,95%在±2標準差,99.7%在±3標準差
- 完全由兩個參數決定:均值(μ)決定中心位置,標準差(σ)決定散布程度
在AI中的應用:
- 許多自然現象和測量誤差都遵循高斯分布
- 機器學習 (ML) 中的假設常基於高斯分布,如高斯朴素貝葉斯
- 推理 (模型推理) (Inference Optimization) (Variational Inference) 和 擴散模型 (擴散生成模型) 等生成模型使用高斯分布作為基礎
- 深度學習中的權重初始化(如Xavier、He初始化)常使用高斯分布
高斯分布的重要性在於中央極限定理 (CLT):大量獨立隨機變量之和趨近於高斯分布,這使其成為統計推斷的核心工具。