Галлюцинации · RAG · надёжность

Почему ИИ галлюцинирует и врёт клиентам — и что с этим делать

Ассистент уверенно называет цену, которой нет, и услугу, которой не существует — клиент верит и уходит недовольным. Галлюцинация — это не «характер ИИ», а инженерный дефект: его можно измерить, снизить до приемлемого уровня и держать под контролем — как latency или ошибки в проде.

от 120 000 ₽
стоимость разработки
ассистент с базой знаний
срок запуска
Галлюцинации ИИRAGБаза знанийGroundingМетрики точностиНадёжность ИИ

Кастомный ассистент на RAG закрывает 94% обращений автоматически — против 60–70% у кнопочных ботов. Это возможно только тогда, когда ответам можно доверять: галлюцинирующего ассистента к клиентам просто не подпустят — Проверить на демо →

Что делать завтра: 5 шагов

1

Собрать источник правды

Соберите в одно место то, чем должен отвечать ассистент: прайсы, регламенты, FAQ, выгрузки из МИС или CRM. Пока фактов нет в базе, модель будет их достраивать — уверенно и складно.

2

Почистить базу

Уберите дубли, устаревшие версии и противоречия. Три версии прайса и два несогласованных регламента — и ИИ выберет «красивое», а не «правильное». Мусор на входе — мусор на выходе; 80% ценности даёт чистый источник.

3

RAG вместо голой модели

Подключите retrieval-augmented generation: сначала поиск находит нужный фрагмент в вашей базе, потом модель отвечает только по нему и даёт ссылку на источник. Выдумывать больше нечего.

4

Метрики точности

Заведите измерение: grounding, hallucination rate, доля честных «не знаю». Гоняйте их как тесты в CI — поменяли базу или промпт, прогнали золотой набор вопросов, поймали регресс. Без этого «стало лучше» — вкусовщина.

5

«Не знаю» вместо выдумки

Настройте правило: нет в базе → честное «уточню у врача / соединю с оператором». Это главный предохранитель от галлюцинаций, особенно там, где цена ошибки высока.

Из чего строится защита от галлюцинаций

RAG поверх базы знаний

Не «лечим модель», а даём ей источник правды и заставляем отвечать только по нему. Сначала поиск находит нужный кусок в вашей базе, потом модель формулирует ответ по нему. Как это работает — разобрали в статье что такое RAG простыми словами.

Чистая база знаний

Собираем и вычищаем источник правды: дубли, устаревшее, противоречия. Режем на осмысленные куски (чанкинг), чтобы поиск находил нужное, и настраиваем, кто держит базу актуальной. Устаревшая база — это вежливая ложь.

Ответ со ссылкой на источник

Ассистент отвечает не «по памяти», а по найденному фрагменту, и показывает, откуда взят факт. Опору на источник (grounding, faithfulness) видно и можно проверить — это не чёрный ящик.

Честное «не знаю» и эскалация

Вместо правдоподобной выдумки на вопрос вне базы — «не знаю, передаю человеку». Человек в петле там, где ошибиться дорого. Настроить это правило — то, что мы делаем в первую очередь.

Строгость контура по цене ошибки

Один движок — разная строгость: флористу порог мягче (ошибся с букетом — не трагедия), клинике жёстче («не знаю, передаю врачу»). Настраиваем под нишу, а не по умолчанию.

Измерение точности

Grounding, hallucination rate, доля честных «не знаю», регресс-тесты на золотом наборе вопросов. Точность — это число, а не ощущение: галлюцинации гоним вниз так же, как latency и error rate.

Что даёт контроль галлюцинаций

94%
обращений закрывает кастомный ассистент — против 60–70% у кнопочных ботов
20 сек
ответ пациенту в сети из 12 клиник — вместо 8 минут
31 ставка
эффект высвобожденных администраторов
<5%
реальная доля ИИ в бизнес-процессах РФ — при 71% «внедривших»

Частые вопросы

Честно — нулевой галлюцинации не гарантирует никто, и кто продаёт «100% без ошибок», занимается инфоцыганством. Наша цель другая: управляемый и измеримый риск, ниже, чем у живого оператора в текучке. Мы заставляем отвечать только по базе, настраиваем «не знаю → передать человеку», измеряем hallucination rate и держим его под порогом, а для высокой цены ошибки ставим более строгий контур и человека в петле. Именно поэтому ассистент дошёл до пациентов в 12 клиниках.

Fine-tune меняет стиль и поведение модели, но плохо держит меняющиеся факты. Прайс поменялся вчера — переобучать модель каждый раз дорого и медленно, это стрельба лазером по воробьям. RAG обновляется мгновенно: поменяли документ в базе — ответ уже другой. Плюс RAG даёт ссылку на источник, а fine-tune — чёрный ящик. На практике часто комбинируем: RAG для фактов, лёгкий тюнинг — для тона.

RAG (retrieval-augmented generation) — это «дать ИИ прочитать вашу шпаргалку перед ответом». Сначала поиск находит нужный фрагмент в вашей базе знаний, потом модель отвечает только по нему и даёт ссылку на источник. Модель перестаёт выдумывать просто потому, что ей есть откуда взять правду. Подробно разобрали в отдельной статье: что такое RAG простыми словами.

Она обучена на всём интернете, а не на вашем прайсе, регламентах и МИС — ваших фактов в ней физически нет. Когда модель не знает ответа, она по умолчанию не молчит, а достраивает правдоподобное. Чем специфичнее вопрос клиента, тем выше риск выдумки. Вопрос не в том, что модель тупая, — она просто не знает ваших фактов, и это чинится не заменой модели на «помощнее», а тем, что мы даём ей ваш источник правды.

Не на глаз. Grounding и faithfulness — опирается ли ответ на источник; hallucination rate — доля выдуманного; доля честных «не знаю» — молчит ли модель, когда правда не знает. Плюс регресс-тесты на золотом наборе вопросов. Гоняем эти метрики как тесты в CI: поменяли базу или промпт — прогнали набор, поймали регресс. Без измерения «стало лучше» — это вкусовщина.

Да, но с более строгим контуром. Чем выше цена ошибки, тем жёстче правило «нет в базе — не выдумывай, передай человеку», и тем важнее человек в петле. В медицине лучше «уточню у врача», чем красивая выдумка. Данные держим на серверах в РФ, по 152-ФЗ, под NDA. Именно строгий контур позволил довести ассистента до пациентов там, где выдумка опаснее всего.

Не обязательно. Простой бот запускается от 7 дней, базовый кастомный — от 49 000 ₽, ассистент с базой знаний и CRM — от 120 000 ₽. По токенам типовой бот — 2 000–5 000 ₽/мес на GPT-4o или менее 1 000 ₽/мес на Alice/YandexGPT. Демо до оплаты бесплатно, результат фиксируем в договоре (KPI, сроки), окупаемость в среднем около 3 месяцев. Основная работа — не «нейросеть», а чистка базы знаний: часто 80% ценности даёт правильно собранный источник правды.

Хотите, чтобы ваш ИИ перестал врать клиентам?

Демо до оплаты — бесплатно. Соберём и вычистим базу знаний, поставим RAG и метрики точности, а KPI и сроки зафиксируем в договоре. Приходите на аудит — покажем, где именно ИИ выдумывает и как это закрыть.