詳細解釋
向量數據庫(Vector Database)是專門存儲和檢索高維向量的數據庫,支持相似度搜索(最近鄰),是檢索增強生成 (RAG)和語義搜索的基礎設施。
核心功能:
- 向量存儲:高效存儲高維向量(通常768-1536維)
- 相似度搜索:基於距離度量(餘弦相似度、歐氏距離)
- 近似最近鄰(ANN):快速檢索,犧牲少量精度
- 元數據過濾:結合屬性過濾和向量搜索
索引算法:
- HNSW(Hierarchical Navigable Small World):
- 圖結構索引
- 高效準確
- 內存型
- IVF(Inverted File):
- 向量量化聚類
- 適合大規模
- LSH(Locality Sensitive Hashing):
- 哈希桶分組
- 快速但精度較低
- 樹結構:Annoy等
主流產品:
- Pinecone:託管服務,易用
- Weaviate:開源,GraphQL接口
- Chroma:輕量,開發友好
- Milvus/Zilliz:企業級,分布式
- Qdrant:開源,Rust編寫
- pgvector:PostgreSQL擴展
應用場景:
- 檢索增強生成 (RAG):文檔檢索
- 語義搜尋:意圖理解而非關鍵詞匹配
- 推薦系統:相似物品檢索
- 圖像搜索:以圖搜圖
- 異常檢測:相似度異常
- 生物信息:分子相似性
選擇考量:
- 規模:百萬、十億級向量
- 延遲:毫秒級或秒級可接受
- 準確性:是否接受近似結果
- 部署:雲服務 vs 本地部署
- 成本:存儲和查詢費用
與傳統數據庫的對比:
- 傳統:精確匹配、範圍查詢
- 向量:相似度搜索
- 結合:多數產品支持混合查詢
向量數據庫是語義搜索時代的基礎設施。
標籤
進階