詳細解釋
抽取式問答(Extractive QA)是從給定文本中抽取連續片段作為答案,而非自由生成,確保答案有明確來源。
運作流程:
- 定位:識別答案可能在的段落
- 起始點:預測答案開始位置
- 結束點:預測答案結束位置
- 抽取:提取該片段作為答案
技術實現:
- Transformer架構 (變換器 / 注意力模型) (Switch Transformer):編碼器理解文本,解碼器預測位置
- SQuAD格式:標註答案起始和結束索引
- 分類問題:對每個token預測是/否答案開始/結束
優勢:
- 有來源:答案必定來自原文
- 準確性:不會憑空捏造
- 可解釋:可高亮顯示答案來源
局限:
- 只能回答文本中有明確答案的問題
- 無法綜合多處資訊推理
- 無法回答「為什麼」、「如何」等推理解釋
應用:
- 法律文檔查詢
- 財報數據提取
- 客服知識庫問答
- 考試題目(閱讀理解)
現代趨勢:大型語言模型 (大語言模型 / 大模型)結合RAG可同時抽取和生成。