Эмбеддинги — векторные представления текста

Эмбеддинги (Embeddings)

Эмбеддинги — числовые векторные представления текста. Модель эмбеддингов преобразует любой текстовый фрагмент в вектор из нескольких сотен чисел таким образом, что семантически похожие тексты получают похожие векторы. Это позволяет измерять смысловое сходство между фразами математически — через косинусное расстояние между векторами.

Как работают эмбеддинги

Модель эмбеддингов — это нейросеть (чаще всего на основе трансформера), которая на выходе даёт не текст, а вектор. Например, текст «запись к врачу» и «записаться на приём» получат близкие векторы, а «рецепт торта» — далёкий. Близость определяется косинусным сходством: 1.0 — идентичные тексты, 0.0 — полностью несвязанные.

Применение в бизнесе: семантический поиск и RAG

В RAG-системах все документы базы знаний предварительно переводятся в эмбеддинги и сохраняются в векторную базу данных. При вопросе пользователя его текст также переводится в вектор, и система находит документы с наибольшим косинусным сходством — это и есть семантический поиск. Такой подход работает даже тогда, когда пользователь формулирует запрос словами, которых нет в документе: смысл совпадает — вектора совпадают.

В медицинском боте PapAI MedScale эмбеддинги на основе E5-multilingual позволяют находить нужный протокол лечения даже при нестандартных формулировках пациентов — точность поиска 91%. Подробнее о продукте.

Модели эмбеддингов для русского языка

Лучшие варианты для русскоязычных корпоративных систем: E5-multilingual (Microsoft, открытая, хорошо работает на русском), text-embedding-3-small / large (OpenAI API, высокое качество, платная), rubert-tiny2 (компактная и быстрая для on-premise), YandexGPT Embeddings (данные остаются в РФ). Размерность вектора: от 384 до 3072 — больше не всегда лучше, важно соответствие домену.

Связанные термины

RAG — архитектура, где эмбеддинги — ключевой компонент поиска
Векторная база данных — хранилище для эмбеддингов
LLM — языковая модель, использующая эмбеддинги внутри

Где применяется

Разработка ИИ-ассистентов → ИИ-консультант →

Хотите внедрить семантический поиск по базе знаний? Обсудим задачу.