詳細解釋
神經網絡(Neural Network)是一種模仿生物神經系統結構的計算模型。它由大量相互連接的「神經元」組成,能夠學習輸入與輸出之間的複雜映射關係。
基本結構:
- 輸入層:接收原始數據(如圖像像素、文字編碼)
- 隱藏層:進行特徵轉換和抽象,層數越多模型越深
- 輸出層:產生最終預測結果
每個連接都有可調整的權重,訓練過程就是不斷調整這些權重,使網絡的輸出更接近期望結果。
現代深度學習 (深度神經網絡)使用數十甚至數百層的神經網絡(稱為深層網絡),能夠學習極其複雜的模式。流行的架構包括Transformer架構 (變換器 / 注意力模型) (Switch Transformer)、卷積神經網絡 (CNN)、生成對抗網絡 (GAN)等。