Российские LLM · on-premise · 152-ФЗ

ИИ-ассистент на российских LLM — без иностранных моделей и без риска по 152-ФЗ

«Нам нельзя ИИ — у нас 152-ФЗ» — это как «нам нельзя интернет, у нас коммерческая тайна». Нельзя как попало — можно правильно. Собираем сильного бизнес-ассистента полностью на российском стеке, с данными на серверах в РФ, и не даём подарить государству 20 млн ₽ штрафа.

от 500 000 ₽
стоимость разработки
on-premise, от 3 недель
срок запуска
Российские LLMGigaChat 3.1Alice AIOn-premise152-ФЗДообучение open-source

71% крупных компаний уже используют генеративный ИИ, но реальная доля ИИ в бизнес-процессах РФ — менее 5%. Внедрили многие, работает у единиц: проблема не в законе, а в том, как внедряют. Лечится правильным стеком — Разобрать мой случай →

152-ФЗ как чек-лист, а не как страх

1

Оценить чувствительность данных

Первый и главный шаг — честно понять, какие у вас данные: ПДн, медданные, клиентская база. От этого зависит, нужен ли изолированный контур вообще, или задачу можно решить проще.

2

Выбрать модель под задачу

Не самую умную, а правильную. Для 90% бизнес-задач хватает дообученной open-source-модели в своём контуре — фронтир на сотни миллиардов параметров, чтобы записать пациента, не нужен.

3

Данные и веса — в РФ

Серверы в России, отсутствие трансграничной передачи ПДн (или оформленной по закону), уведомление в Роскомнадзор об обработке — иначе 100–300 тыс. ₽ за молчание.

4

Изолировать контур

Ассистент и модель работают внутри периметра, интеграции локальные, режим доступа — NDA, разграничение прав, логирование. Именно здесь чаще всего спотыкаются самодельные внедрения.

5

Мерить KPI, а не факт внедрения

Считаем не «мы внедрили ИИ», а результат в цифрах: процент автозакрытия, время ответа, окупаемость. Ни один из шагов не требует иностранной модели.

Российский стек 2026: из чего собираем

GigaChat 3.1 (Сбер, MIT)

Ключевое событие года: GigaChat 3.1 Ultra/Lightning выложены под лицензией MIT (март 2026). Значит, законно ставим на своё железо и дообучаем — сильная открытая модель приходит к данным внутрь, а не наоборот.

Alice AI (бывш. YandexGPT)

Reasoning, контекст 128k токенов, конструктор агентов. Дешёвые токены: типовой ассистент — менее 1 000 ₽/мес. Подходит там, где не нужен полный on-premise, но нужен российский контур.

Cotype и T-pro 2.0

Cotype от МТС (линейки Pro и Light) и T-pro 2.0 от Т-Банка (open-weight). Выбор модели — внутренняя деталь: на границу периметра он не влияет, менять можно под задачу.

On-premise на вашем железе

Для чувствительных данных — модель и ассистент внутри вашего периметра. Данные и веса физически в РФ, ни одна стрелка потока данных не пересекает границу контура наружу.

Дообучение open-source

86% компаний дообучают open-source (Яков и Партнёры × Яндекс). Модель учится на вашем прайсе, регламенте и документах — отвечает по делу, а не «в общем».

PapAI.Core — единое ядро

Каждый ассистент — автономный агент под единым интеллектуальным ядром: российская LLM + RAG на ваших данных, интеграции с 1С, МИС, amoCRM, Битрикс24 — локальные. Это не бот, это ассистент.

Цифры, на которые опираемся

до 20 млн ₽
штраф за утечку ПДн (с мая 2025)
менее 5%
реальная доля ИИ в процессах РФ
86%
компаний дообучают open-source
94%
обращений закрывает кастомный ассистент

Частые вопросы

Для фронтир-ресёрча разрыв есть, честно. Но для бизнес-ассистента — запись, поддержка, продажи, разбор документов — дообученная GigaChat 3.1 или Alice закрывает задачу. Мы меряем не бенчмарки, а результат: кастомный ассистент закрывает 94% обращений против 60–70% у кнопочных ботов. Вопрос не «чья модель умнее», а «что попадает в KPI».

Зависит от чувствительности данных. Для медданных и финсектора цена утечки — до 20 млн ₽ штрафа плюс репутация, поэтому контур окупается риском. По токенам типовой ассистент на Alice/YandexGPT — менее 1 000 ₽/мес, окупаемость проектов в среднем около 3 месяцев. On-premise — не для всех, это архитектурное решение под уровень риска, и мы его считаем на аудите до оплаты.

Отличный вопрос. Барьер на иностранные модели сняли, маркировку ИИ-контента убрали — юридически можно и то, и другое. Но 152-ФЗ по персональным данным никто не отменял, и оборотные штрафы за утечки остались. Для чувствительных данных суверенный стек в контуре РФ — это выбор по управлению риском, а не «потому что заставили». Где данные не чувствительны — берите что удобнее, мы не догматики.

Ключ к комплаенсу — где физически живут данные и веса модели. On-premise или изолированный контур в РФ плюс отсутствие трансграничной передачи ПДн = вы контролируете периметр, а не чужое облако. 152-ФЗ пугает, пока абстрактный; разложенный на шаги — это обычный инженерный чек-лист: данные и веса в РФ, уведомление в РКН, изоляция контура, режим доступа.

Да. Сеть из 12 клиник, ассистент на российском стеке, всё в контуре: время ответа пациенту — с 8 минут до 20 секунд, высвобожденный эффект — 31 ставка администраторов, и всё это при соблюдённом 152-ФЗ. Медданные — максимально чувствительная категория, поэтому кейс и показательный. Демо-бота можно попробовать до начала работ.

Нет. Он помогает, а не конкурирует — снимает рутину первой линии, как перфоратор не заменил строителей. Оператору остаётся то, где нужен человек, а типовые обращения ассистент закрывает сам. В кейсе с клиниками высвобожденный ресурс пошёл не на сокращения, а на разгрузку перегруженных администраторов.

Интеграции локальные: 1С, медицинские системы, amoCRM, Битрикс24 — внутри вашего контура. On-premise-развёртывание — от 3 недель в зависимости от инфраструктуры и объёма дообучения. Точные сроки и KPI фиксируем в договоре, а архитектуру и экономику считаем на аудите до оплаты.

Думали, что ИИ вам закрыт из-за чувствительных данных?

Приходите на аудит — посчитаем архитектуру и экономику ассистента на российском стеке до оплаты, бесплатно. Результат — KPI и сроки — фиксируем в договоре. Демо-бота можно попробовать сразу.