詳細解釋
預測蛋白質三維結構的計算問題,由 DeepMind 的 AlphaFold 在 2020-2021 年突破,被認為是 AI 在科學領域最重大的成就之一。
科學意義:
- 結構決定功能:蛋白質形狀決定其生物作用
- 實驗瓶頸:X 射線晶體學、冷凍電鏡耗時數月、成本高昂
- 2 億蛋白質:AlphaFold 預測了幾乎所有人類已知蛋白質
技術方法:
- 進化特徵:多序列比對(MSA)編碼進化信息
- 注意力機制:殘基對之間的關係建模
- 結構模塊:從抽象表示迭代精煉 3D 坐標
- 信心預測:每個殘基的預測可靠性
評估指標:
- GDT-TS:與實驗結構的相似度
- RMSD:原子位置的均方根偏差
- lDDT:局部距離差異測試
- AlphaFold 達到「實驗級精度」
應用影響:
- 藥物設計:理解疾病機制,設計靶向藥物
- 合成生物學:設計新酶用於工業生產
- 農業:改良作物抗病蛋白
- 環境:塑料降解酶、碳捕獲蛋白
AlphaFold 之後:
- AlphaFold DB:免費開放的 2 億蛋白質結構數據庫
- 開源實現:ColabFold 讓小實驗室也能使用
- 競爭者:Meta ESMFold、Chai Discovery
局限:
- 動態結構:無法預測蛋白質運動和變化
- 複合物:多蛋白質交互預測仍在發展
- 膜蛋白:準確性相對較低
這是「AI for Science」的里程碑—— 解決了困擾生物學 50 年的難題。