Как работает поиск в векторной базе
При индексации каждый документ переводится в вектор через модель эмбеддингов и сохраняется. При запросе вектор запроса сравнивается со всеми хранимыми векторами через ANN-алгоритмы (HNSW, IVF, ScaNN) — они находят k ближайших за 10–50 мс даже на миллионах документов. Возвращаются топ-N наиболее похожих чанков, которые передаются LLM как контекст.
Обзор популярных векторных баз
- Qdrant — open source, написан на Rust, высокая производительность, активно развивается, хорошо для on-premise в РФ
- Weaviate — open source, встроенные модули эмбеддингов, гибкая схема, GraphQL API
- Pinecone — облачный managed-сервис, простая интеграция, нет self-hosted варианта
- pgvector — расширение PostgreSQL, удобно если уже используете Postgres, производительность ниже специализированных решений
- ChromaDB — лёгкий, отлично подходит для прототипов и небольших баз (до 100K документов)
В проектах PapAI Soft для российских компаний используем Qdrant: самостоятельное развёртывание на серверах клиента, данные остаются в российском периметре, поиск по 50K документов — 15–30 мс.
Связанные термины
- Эмбеддинги — что хранится в векторной базе
- RAG — архитектура, где векторная база — хранилище знаний
- LLM — получает результаты поиска из векторной базы
Где применяется
Хотите развернуть векторную базу знаний? Обсудим задачу.
Связаться с нами