🚀 2026 全民被動收入指南，賺錢就是 Easy Job

關於我們聯絡我們

易賺AiEasyJobAi

4高級模型架構

人類回饋強化學習

RLHF

利用人類偏好數據訓練LLM的對齊方法

詳細解釋

RLHF（Reinforcement Learning from Human Feedback）是用人類偏好回饋來訓練大型語言模型 (大語言模型 / 大模型)的強化學習方法，讓模型輸出更符合人類價值觀。

流程：

收集人類對輸出的偏好排名
訓練獎勵模型預測人類偏好
用強化學習優化大型語言模型 (大語言模型 / 大模型)以最大化獎勵

ChatGPT、Claude等大型語言模型 (大語言模型 / 大模型)都採用RLHF提升安全性與有用性。

相關AI領域

AI倫理與安全

相關詞彙

透過試錯與獎勵機制學習最佳決策的方法

確保AI目標與人類價值觀一致的議題

探索更多AI詞彙

查看所有分類，繼續學習AI知識

基礎概念模型架構技術工具應用場景全部詞彙