alibaba

zvec

Database#Vector Database#AI#Embeddings#Search#Python

9,527

// 项目简介

Zvec 是一款开源的进程内向量数据库，旨在为应用程序直接提供高性能的相似度搜索功能。它支持稠密向量和稀疏向量，并通过预写式日志确保数据持久性。该库具有极高的可移植性，可在 Linux、macOS 和 Windows 等多种平台上运行，无需任何外部服务器配置。

// 技术分析

Zvec 是一个开源的进程内向量数据库，旨在直接在应用程序内提供轻量级、高性能的相似度搜索功能。通过消除对外部服务器基础设施的需求，它简化了从本地笔记本到边缘设备等各种环境的部署。该项目通过预写日志（write-ahead logging）实现数据持久化以及优化的 SIMD 执行等功能，优先考虑生产级的可靠性，使其成为需要可扩展向量搜索且无需传统数据库管理开销的开发者的多功能解决方案。

// 核心亮点

提供高速相似度搜索，能够在毫秒级处理数十亿个向量。

作为进程内库运行，消除了管理外部服务器或配置的复杂性。

支持稠密和稀疏向量，并具备在单次操作中进行多向量查询的原生能力。

通过将语义相似度与结构化过滤相结合，实现混合搜索，从而获得更精确的检索结果。

通过预写日志确保数据持久性，防止进程崩溃或电源故障导致的数据丢失。

通过 RabitQ 量化和 CPU 自动调度优化性能，实现高效的 SIMD 执行。

// 典型使用场景

针对稠密和稀疏嵌入的高速相似度搜索

结合语义相似度与结构化过滤的混合搜索

用于 AI Agent 和边缘设备应用的嵌入式向量存储

// 快速开始

要开始使用 Zvec，请通过 Python 的 pip 或 Node.js 的 npm 安装该库。安装完成后，定义您的集合模式（collection schema），创建或打开一个本地集合路径，然后使用提供的 API 插入文档并执行向量相似度查询。