2初級模型架構
LRM (大型推理模型 / Large Reasoning Models)
Large Reasoning Models (LRM)
具備深層邏輯推理能力的模型,如 OpenAI o1 系列,強調推理而非僅語言模式
詳細解釋
大型推理模型(LRM)泛指以「深層邏輯推理」為設計重點的 大型語言模型 (大語言模型 / 大模型),與傳統以語言建模與 思維鏈 (CoT / Few Shot CoT) 為主的模型區隔:在內部進行更長、更結構化的推理步驟,再輸出結論。
代表產品如 OpenAI 的 o1、o1-mini:訓練目標更偏向推理與數學能力,推理 (模型推理) (Inference Optimization) (Variational Inference) 時可能消耗較多 參數量 與算力。適用於需要嚴謹推導的任務(數學、程式、科學分析),而非單純問答或創作。
與 Transformer架構 (變換器 / 注意力模型) (Switch Transformer)、基礎模型 同屬大模型演進的一支,常與「reasoning」「o1」等關鍵字一起討論。