Российские LLM · on-premise · 152-ФЗ
ИИ-ассистент на российских LLM — без иностранных моделей и без риска по 152-ФЗ
«Нам нельзя ИИ — у нас 152-ФЗ» — это как «нам нельзя интернет, у нас коммерческая тайна». Нельзя как попало — можно правильно. Собираем сильного бизнес-ассистента полностью на российском стеке, с данными на серверах в РФ, и не даём подарить государству 20 млн ₽ штрафа.
71% крупных компаний уже используют генеративный ИИ, но реальная доля ИИ в бизнес-процессах РФ — менее 5%. Внедрили многие, работает у единиц: проблема не в законе, а в том, как внедряют. Лечится правильным стеком — Разобрать мой случай →
152-ФЗ как чек-лист, а не как страх
Оценить чувствительность данных
Первый и главный шаг — честно понять, какие у вас данные: ПДн, медданные, клиентская база. От этого зависит, нужен ли изолированный контур вообще, или задачу можно решить проще.
Выбрать модель под задачу
Не самую умную, а правильную. Для 90% бизнес-задач хватает дообученной open-source-модели в своём контуре — фронтир на сотни миллиардов параметров, чтобы записать пациента, не нужен.
Данные и веса — в РФ
Серверы в России, отсутствие трансграничной передачи ПДн (или оформленной по закону), уведомление в Роскомнадзор об обработке — иначе 100–300 тыс. ₽ за молчание.
Изолировать контур
Ассистент и модель работают внутри периметра, интеграции локальные, режим доступа — NDA, разграничение прав, логирование. Именно здесь чаще всего спотыкаются самодельные внедрения.
Мерить KPI, а не факт внедрения
Считаем не «мы внедрили ИИ», а результат в цифрах: процент автозакрытия, время ответа, окупаемость. Ни один из шагов не требует иностранной модели.
Российский стек 2026: из чего собираем
GigaChat 3.1 (Сбер, MIT)
Ключевое событие года: GigaChat 3.1 Ultra/Lightning выложены под лицензией MIT (март 2026). Значит, законно ставим на своё железо и дообучаем — сильная открытая модель приходит к данным внутрь, а не наоборот.
Alice AI (бывш. YandexGPT)
Reasoning, контекст 128k токенов, конструктор агентов. Дешёвые токены: типовой ассистент — менее 1 000 ₽/мес. Подходит там, где не нужен полный on-premise, но нужен российский контур.
Cotype и T-pro 2.0
Cotype от МТС (линейки Pro и Light) и T-pro 2.0 от Т-Банка (open-weight). Выбор модели — внутренняя деталь: на границу периметра он не влияет, менять можно под задачу.
On-premise на вашем железе
Для чувствительных данных — модель и ассистент внутри вашего периметра. Данные и веса физически в РФ, ни одна стрелка потока данных не пересекает границу контура наружу.
Дообучение open-source
86% компаний дообучают open-source (Яков и Партнёры × Яндекс). Модель учится на вашем прайсе, регламенте и документах — отвечает по делу, а не «в общем».
PapAI.Core — единое ядро
Каждый ассистент — автономный агент под единым интеллектуальным ядром: российская LLM + RAG на ваших данных, интеграции с 1С, МИС, amoCRM, Битрикс24 — локальные. Это не бот, это ассистент.
Цифры, на которые опираемся
Частые вопросы
Для фронтир-ресёрча разрыв есть, честно. Но для бизнес-ассистента — запись, поддержка, продажи, разбор документов — дообученная GigaChat 3.1 или Alice закрывает задачу. Мы меряем не бенчмарки, а результат: кастомный ассистент закрывает 94% обращений против 60–70% у кнопочных ботов. Вопрос не «чья модель умнее», а «что попадает в KPI».
Зависит от чувствительности данных. Для медданных и финсектора цена утечки — до 20 млн ₽ штрафа плюс репутация, поэтому контур окупается риском. По токенам типовой ассистент на Alice/YandexGPT — менее 1 000 ₽/мес, окупаемость проектов в среднем около 3 месяцев. On-premise — не для всех, это архитектурное решение под уровень риска, и мы его считаем на аудите до оплаты.
Отличный вопрос. Барьер на иностранные модели сняли, маркировку ИИ-контента убрали — юридически можно и то, и другое. Но 152-ФЗ по персональным данным никто не отменял, и оборотные штрафы за утечки остались. Для чувствительных данных суверенный стек в контуре РФ — это выбор по управлению риском, а не «потому что заставили». Где данные не чувствительны — берите что удобнее, мы не догматики.
Ключ к комплаенсу — где физически живут данные и веса модели. On-premise или изолированный контур в РФ плюс отсутствие трансграничной передачи ПДн = вы контролируете периметр, а не чужое облако. 152-ФЗ пугает, пока абстрактный; разложенный на шаги — это обычный инженерный чек-лист: данные и веса в РФ, уведомление в РКН, изоляция контура, режим доступа.
Да. Сеть из 12 клиник, ассистент на российском стеке, всё в контуре: время ответа пациенту — с 8 минут до 20 секунд, высвобожденный эффект — 31 ставка администраторов, и всё это при соблюдённом 152-ФЗ. Медданные — максимально чувствительная категория, поэтому кейс и показательный. Демо-бота можно попробовать до начала работ.
Нет. Он помогает, а не конкурирует — снимает рутину первой линии, как перфоратор не заменил строителей. Оператору остаётся то, где нужен человек, а типовые обращения ассистент закрывает сам. В кейсе с клиниками высвобожденный ресурс пошёл не на сокращения, а на разгрузку перегруженных администраторов.
Интеграции локальные: 1С, медицинские системы, amoCRM, Битрикс24 — внутри вашего контура. On-premise-развёртывание — от 3 недель в зависимости от инфраструктуры и объёма дообучения. Точные сроки и KPI фиксируем в договоре, а архитектуру и экономику считаем на аудите до оплаты.
