詳細解釋
差分隱私(Differential Privacy)是數學上嚴格的隱私保護框架,通過添加精心設計的噪聲,確保個人數據對查詢結果的影響不可區分。
核心概念:
- ε-差分隱私:隱私預算參數,ε越小隱私保護越強
- (ε,δ)-差分隱私:鬆弛版本,允許小概率失敗
- 鄰接數據集:只差一條記錄的兩個數據集
- 不可區分性:輸出分布幾乎相同
機制:
- Laplace機制:連續值添加Laplace噪聲
- 指數機制:離散選擇的隱私保護
- 高斯機制:連續值添加高斯噪聲
- 隨機響應:二元屬性的隱私保護
應用:
- 聯邦學習:保護模型更新
- 數據發布:發布統計數據
- 機器學習:隱私保護訓練
- 查詢系統:數據庫查詢保護
特性:
- 組合性:多次查詢隱私損失可計算
- 後處理免疫:後續處理不降低隱私
- 並行組合:不相交數據集分別保護
工具:
- Google DP Library
- Opacus(PyTorch)
- TensorFlow Privacy
- IBM Diffprivlib
差分隱私是隱私計算的黃金標準。