非自回歸解碼

Non-autoregressive Decoding

可並行生成多token

詳細解釋

非自回歸解碼(Non-Autoregressive Decoding)是可並行生成多token的解碼方式,犧牲品質換取速度。

自回歸解碼的對比:

  • 自回歸:逐token,串行,品質高,慢
  • 非自回歸:一次多token,並行,品質較低,快

類型:

  • 純非自回歸:完全並行
  • 半自回歸:迭代精煉(如Mask-Predict)
  • 多階段:粗到細生成

方法:

  • Mask-Predict:遮罩部分token,迭代預測
  • CTC:連接時序分類
  • 知識蒸餾:從自回歸教師學習

應用:

  • 機器翻譯:早期非自回歸研究
  • 語音識別:CTC解碼
  • 需要極速的場景

挑戰:

  • 品質差距:通常不如自回歸
  • 條件獨立假設:token間獨立難建模
  • 多模態:輸出多樣性vs確定性

現代發展:

  • 投機解碼:自回歸+小模型加速
  • 非自回歸仍研究活躍
  • 但在LLM主流仍是自回歸

是加速生成的研究方向之一。

探索更多AI詞彙

查看所有分類,繼續學習AI知識