Как работают эмбеддинги
Модель эмбеддингов — это нейросеть (чаще всего на основе трансформера), которая на выходе даёт не текст, а вектор. Например, текст «запись к врачу» и «записаться на приём» получат близкие векторы, а «рецепт торта» — далёкий. Близость определяется косинусным сходством: 1.0 — идентичные тексты, 0.0 — полностью несвязанные.
Применение в бизнесе: семантический поиск и RAG
В RAG-системах все документы базы знаний предварительно переводятся в эмбеддинги и сохраняются в векторную базу данных. При вопросе пользователя его текст также переводится в вектор, и система находит документы с наибольшим косинусным сходством — это и есть семантический поиск. Такой подход работает даже тогда, когда пользователь формулирует запрос словами, которых нет в документе: смысл совпадает — вектора совпадают.
В медицинском боте PapAI MedScale эмбеддинги на основе E5-multilingual позволяют находить нужный протокол лечения даже при нестандартных формулировках пациентов — точность поиска 91%. Подробнее о продукте.
Модели эмбеддингов для русского языка
Лучшие варианты для русскоязычных корпоративных систем: E5-multilingual (Microsoft, открытая, хорошо работает на русском), text-embedding-3-small / large (OpenAI API, высокое качество, платная), rubert-tiny2 (компактная и быстрая для on-premise), YandexGPT Embeddings (данные остаются в РФ). Размерность вектора: от 384 до 3072 — больше не всегда лучше, важно соответствие домену.
Связанные термины
- RAG — архитектура, где эмбеддинги — ключевой компонент поиска
- Векторная база данных — хранилище для эмбеддингов
- LLM — языковая модель, использующая эмбеддинги внутри
Где применяется
Хотите внедрить семантический поиск по базе знаний? Обсудим задачу.
Связаться с нами