向量資料庫

Vector Database

存儲和檢索高維向量嵌入的專用資料庫

詳細解釋

向量數據庫(Vector Database)是專門存儲和檢索高維向量的數據庫,支持相似度搜索(最近鄰),是檢索增強生成 (RAG)和語義搜索的基礎設施。

核心功能:

  • 向量存儲:高效存儲高維向量(通常768-1536維)
  • 相似度搜索:基於距離度量(餘弦相似度、歐氏距離)
  • 近似最近鄰(ANN):快速檢索,犧牲少量精度
  • 元數據過濾:結合屬性過濾和向量搜索

索引算法:

  • HNSW(Hierarchical Navigable Small World):
  • 圖結構索引
  • 高效準確
  • 內存型
  • IVF(Inverted File):
  • 向量量化聚類
  • 適合大規模
  • LSH(Locality Sensitive Hashing):
  • 哈希桶分組
  • 快速但精度較低
  • 樹結構:Annoy等

主流產品:

  • Pinecone:託管服務,易用
  • Weaviate:開源,GraphQL接口
  • Chroma:輕量,開發友好
  • Milvus/Zilliz:企業級,分布式
  • Qdrant:開源,Rust編寫
  • pgvector:PostgreSQL擴展

應用場景:

  • 檢索增強生成 (RAG):文檔檢索
  • 語義搜尋:意圖理解而非關鍵詞匹配
  • 推薦系統:相似物品檢索
  • 圖像搜索:以圖搜圖
  • 異常檢測:相似度異常
  • 生物信息:分子相似性

選擇考量:

  • 規模:百萬、十億級向量
  • 延遲:毫秒級或秒級可接受
  • 準確性:是否接受近似結果
  • 部署:雲服務 vs 本地部署
  • 成本:存儲和查詢費用

與傳統數據庫的對比:

  • 傳統:精確匹配、範圍查詢
  • 向量:相似度搜索
  • 結合:多數產品支持混合查詢

向量數據庫是語義搜索時代的基礎設施。

標籤

進階

探索更多AI詞彙

查看所有分類,繼續學習AI知識