Векторная база данных

Векторная база данных — специализированное хранилище числовых векторов (эмбеддингов), оптимизированное для поиска ближайших соседей (ANN — Approximate Nearest Neighbor). Поиск ведётся не по точному совпадению текста, а по математической близости векторов в многомерном пространстве. Это ключевой компонент любой RAG-системы.

Как работает поиск в векторной базе

При индексации каждый документ переводится в вектор через модель эмбеддингов и сохраняется. При запросе вектор запроса сравнивается со всеми хранимыми векторами через ANN-алгоритмы (HNSW, IVF, ScaNN) — они находят k ближайших за 10–50 мс даже на миллионах документов. Возвращаются топ-N наиболее похожих чанков, которые передаются LLM как контекст.

Обзор популярных векторных баз

  • Qdrant — open source, написан на Rust, высокая производительность, активно развивается, хорошо для on-premise в РФ
  • Weaviate — open source, встроенные модули эмбеддингов, гибкая схема, GraphQL API
  • Pinecone — облачный managed-сервис, простая интеграция, нет self-hosted варианта
  • pgvector — расширение PostgreSQL, удобно если уже используете Postgres, производительность ниже специализированных решений
  • ChromaDB — лёгкий, отлично подходит для прототипов и небольших баз (до 100K документов)

В проектах PapAI Soft для российских компаний используем Qdrant: самостоятельное развёртывание на серверах клиента, данные остаются в российском периметре, поиск по 50K документов — 15–30 мс.

Связанные термины

  • Эмбеддинги — что хранится в векторной базе
  • RAG — архитектура, где векторная база — хранилище знаний
  • LLM — получает результаты поиска из векторной базы

Где применяется

Разработка ИИ-ассистентов → PapAI MedScale →

Хотите развернуть векторную базу знаний? Обсудим задачу.

Связаться с нами