Roofline 模型

Roofline Model

以算力與記憶體頻寬為上限評估運算效能的分析模型,可判斷 圖形處理單元 (GPU / 圖形處理器) 或 kernel 是算力受限還是頻寬受限。

詳細解釋

Roofline 模型以 X 軸為運算強度(FLOP/byte)、Y 軸為效能(GFLOPS),畫出算力頂(水平線)與記憶體頻寬頂(斜線),兩者交點為 ridge point。若運算強度低於此點則為記憶體受限、高於則為算力受限,可指導 算子融合、tiling 等優化。與 圖形處理單元 (GPU / 圖形處理器)推理 (模型推理) (Inference Optimization) (Variational Inference)算子融合 相關。

探索更多AI詞彙

查看所有分類,繼續學習AI知識