GPT-4V (GPT-4 Vision / 視覺多模態)

GPT-4V (GPT-4 Vision)

OpenAI 的 GPT (生成式預訓練變換器)-4 視覺版,可接受影像輸入並與文字一起理解與生成,為多模態 大型語言模型 (大語言模型 / 大模型)

詳細解釋

GPT-4V(GPT-4 Vision)於 2023 年 9 月推出,讓 GPT (生成式預訓練變換器)-4 能分析影像與文字輸入,應用於圖表解讀、文件理解、無障礙與創意任務。2024 年 GPT-4o(omni)進一步整合文字、影像、語音輸入與輸出,延遲更低、多語言與視覺能力更強。透過 OpenAI API 可呼叫視覺模型。與 GPT (生成式預訓練變換器)OpenAI API大型語言模型 (大語言模型 / 大模型)多模態 AI 相關。

探索更多AI詞彙

查看所有分類,繼續學習AI知識