1入門模型架構
模型架構
Model Architecture
神經網絡 (類神經網路) 或 ML 模型的層級結構、連接方式與模組設計,如 Transformer架構 (變換器 / 注意力模型) (Switch Transformer)、卷積神經網絡 (CNN)、ResNet 等。
詳細解釋
模型架構指模型的結構定義:有哪些層、如何連接、是否含注意力、卷積、殘差等。不同架構適用不同資料與任務:卷積神經網絡 (CNN) 常用於影像、Transformer架構 (變換器 / 注意力模型) (Switch Transformer) 用於序列與 大型語言模型 (大語言模型 / 大模型)、GNN 用於圖資料。選擇與設計架構影響容量、效率與歸納偏置。與 Transformer架構 (變換器 / 注意力模型) (Switch Transformer)、卷積神經網絡 (CNN)、神經網絡 (類神經網路)、大型語言模型 (大語言模型 / 大模型) 相關。