Question 1

Вы гарантируете, что ИИ вообще не наврёт — 0 галлюцинаций?

Accepted Answer

Честно — нулевой галлюцинации не гарантирует никто, и кто продаёт «100% без ошибок», занимается инфоцыганством. Наша цель другая: управляемый и измеримый риск, ниже, чем у живого оператора в текучке. Мы заставляем отвечать только по базе, настраиваем «не знаю → передать человеку», измеряем hallucination rate и держим его под порогом, а для высокой цены ошибки ставим более строгий контур и человека в петле. Именно поэтому ассистент дошёл до пациентов в 12 клиниках.

Question 2

Почему просто не дообучить (fine-tune) модель на наших данных? Зачем RAG?

Accepted Answer

Fine-tune меняет стиль и поведение модели, но плохо держит меняющиеся факты. Прайс поменялся вчера — переобучать модель каждый раз дорого и медленно, это стрельба лазером по воробьям. RAG обновляется мгновенно: поменяли документ в базе — ответ уже другой. Плюс RAG даёт ссылку на источник, а fine-tune — чёрный ящик. На практике часто комбинируем: RAG для фактов, лёгкий тюнинг — для тона.

Question 3

Что такое RAG простыми словами?

Accepted Answer

RAG (retrieval-augmented generation) — это «дать ИИ прочитать вашу шпаргалку перед ответом». Сначала поиск находит нужный фрагмент в вашей базе знаний, потом модель отвечает только по нему и даёт ссылку на источник. Модель перестаёт выдумывать просто потому, что ей есть откуда взять правду. Подробно разобрали в отдельной статье: что такое RAG простыми словами.

Question 4

Почему общая модель врёт именно на нашей специфике?

Accepted Answer

Она обучена на всём интернете, а не на вашем прайсе, регламентах и МИС — ваших фактов в ней физически нет. Когда модель не знает ответа, она по умолчанию не молчит, а достраивает правдоподобное. Чем специфичнее вопрос клиента, тем выше риск выдумки. Вопрос не в том, что модель тупая, — она просто не знает ваших фактов, и это чинится не заменой модели на «помощнее», а тем, что мы даём ей ваш источник правды.

Question 5

Как вы измеряете, что стало лучше?

Accepted Answer

Не на глаз. Grounding и faithfulness — опирается ли ответ на источник; hallucination rate — доля выдуманного; доля честных «не знаю» — молчит ли модель, когда правда не знает. Плюс регресс-тесты на золотом наборе вопросов. Гоняем эти метрики как тесты в CI: поменяли базу или промпт — прогнали набор, поймали регресс. Без измерения «стало лучше» — это вкусовщина.

Question 6

Можно ли ставить ИИ туда, где цена ошибки высока — в медицину или финансы?

Accepted Answer

Да, но с более строгим контуром. Чем выше цена ошибки, тем жёстче правило «нет в базе — не выдумывай, передай человеку», и тем важнее человек в петле. В медицине лучше «уточню у врача», чем красивая выдумка. Данные держим на серверах в РФ, по 152-ФЗ, под NDA. Именно строгий контур позволил довести ассистента до пациентов там, где выдумка опаснее всего.

Question 7

Сколько это стоит и сколько занимает — это же большой проект?

Accepted Answer

Не обязательно. Простой бот запускается от 7 дней, базовый кастомный — от 49 000 ₽, ассистент с базой знаний и CRM — от 120 000 ₽. По токенам типовой бот — 2 000–5 000 ₽/мес на GPT-4o или менее 1 000 ₽/мес на Alice/YandexGPT. Демо до оплаты бесплатно, результат фиксируем в договоре (KPI, сроки), окупаемость в среднем около 3 месяцев. Основная работа — не «нейросеть», а чистка базы знаний: часто 80% ценности даёт правильно собранный источник правды.

Почему ИИ галлюцинирует и врёт клиентам — и что с этим делать

Что делать завтра: 5 шагов

Из чего строится защита от галлюцинаций

Что даёт контроль галлюцинаций

Частые вопросы

Хотите, чтобы ваш ИИ перестал врать клиентам?