預訓練模型

Pretrained Model

在大規模數據上預先訓練的模型

詳細解釋

預訓練模型(Pretrained Model)是在大規模通用數據上預先訓練的模型,提供通用能力,可通過微調適配特定任務。

預訓練階段:

  • 數據:網頁、書籍、論文等海量文本
  • 任務:下詞預測或遮罩語言模型
  • 時間:數週至數月,耗費巨大算力
  • 結果:學到語言能力和世界知識

優勢:

  • 節省成本:無需從零訓練大模型
  • 小數據微調:特定任務只需少量數據
  • 泛化能力:預訓練學到通用表示
  • 快速迭代:快速適配新領域

使用方式:

代表模型:

是現代NLP的標準範式。

探索更多AI詞彙

查看所有分類,繼續學習AI知識