強化學習

Reinforcement Learning

透過試錯與獎勵機制學習最佳決策的方法

詳細解釋

強化學習(RL)是機器學習 (ML)的一種,代理(Agent)透過與環境互動、獲得獎勵或懲罰來學習最佳策略,無需大量標記數據。

核心概念:

應用:遊戲AI、AI代理、機器人控制、聊天機器人 (對話機器人 / Chatbot)的對齊訓練。

相關AI領域

探索更多AI詞彙

查看所有分類,繼續學習AI知識