詳細解釋
雅可比矩陣(Jacobian Matrix)是多變量函數的一階偏導數組成的矩陣,描述向量值函數在某一點的局部線性近似。
定義:
對於函數 f: Rⁿ → Rᵐ,雅可比矩陣J是一個 m×n 矩陣:
Jᵢⱼ = ∂fᵢ/∂xⱼ
意義:
- 局部線性化:函數在某點附近的最好線性近似
- 變換率:輸入微小變化引起的輸出變化
- 幾何意義:體積變換的比例(行列式)和方向變換(矩陣本身)
在機器學習中的應用:
- 反向傳播:計算梯度時的鏈式法則涉及雅可比矩陣
- 優化:牛頓法和擬牛頓法使用Hessian矩陣(二階導數)
- 生成模型:正規化流中的變量變換公式
- 變分推斷:重參數技巧中的導數計算
與Hessian的關係:
- 雅可比:一階導數,描述斜率
- 海森矩陣:二階導數,描述曲率
- Hessian是梯度的雅可比矩陣
計算工具:
- 自動微分:PyTorch (Torch Compile)、TensorFlow自動計算
- 符號計算:SymPy、Mathematica
- 數值微分:有限差分法
雅可比矩陣是多變量分析的核心工具。