Разработка ИИ — Под ключ
Разработка ИИ ассистентов под ключ: процесс, технологии и цены
Проектируем архитектуру, разрабатываем backend, обучаем модель, подключаем мессенджеры и CRM. Сдаём работающий ассистент по акту за 3–5 недель.
Реальный результат: ИИ-ассистент в HR — +50% обработанных заявок и +3,38 млн ₽ экономии в год — кейс HR AI Manager
Этапы разработки
Проектирование архитектуры
Выбираем модель (GPT-4o, YandexGPT, локальная LLM), способ хранения векторной базы (Qdrant, pgvector), систему интеграций. Фиксируем в техдоке.
Подготовка данных
Парсим, чистим, разбиваем на чанки. Строим векторную базу для RAG. От качества данных зависит точность ответов.
Разработка ядра
Python + FastAPI на backend, обработка контекста, system prompt под вашу тональность, маршрутизация сценариев.
Интеграции
Telegram Bot API, WhatsApp Business, AmoCRM, Битрикс24, 1С, виджет на сайт — модули собираются под ваши каналы.
Тестирование и пилот
Прогон тестовых наборов вопросов, замер точности, нагрузочные тесты. Пилот на ограниченном потоке клиентов.
Что разрабатываем
RAG-поиск по базе знаний
Ассистент ищет ответ в вашей базе (регламенты, FAQ, прайсы) и формулирует на её основе — без галлюцинаций.
Многошаговые диалоги
Помнит контекст в рамках сессии, ведёт диалог по сценарию (запись, квалификация, заказ) с возвратом в любой шаг.
Function calling
Ассистент вызывает функции — проверить наличие на складе, забронировать слот, создать сделку в CRM — без выхода из диалога.
Маршрутизация эскалаций
По сигналам (нецензурная лексика, повторный вопрос, упоминание юриста) автоматически передаёт оператору с историей.
Админ-панель на React
Просмотр диалогов, правка ответов, выгрузка отчётов, управление базой знаний — без программистов.
Логирование и метрики
Каждый ответ логируется с источником, токенами, временем. Метрики — в Grafana или Metabase.
Цифры разработки
Частые вопросы
Python + FastAPI на backend, PostgreSQL + Qdrant/pgvector для векторной базы, GPT-4o или YandexGPT как LLM, Docker для деплоя, React для админ-панели.
Мы. По итогам аудита формулируем требования к функциям, интеграциям, метрикам. От вас — согласование.
По договору можно оставить у нас (cheaper) или передать вам. Если передаём — комментируем код и пишем техническую документацию.
Да. Поставляем Docker Compose или Helm Chart. Минимальные требования: 8 ГБ RAM, 4 vCPU, 50 ГБ диска. LLM — внешний API или локальная модель.
При использовании YandexGPT и серверов в РФ — да. Подписываем соглашение об обработке ПДн, при необходимости — БДУ ФСТЭК.
Один экземпляр обрабатывает до 50 одновременных диалогов. Масштабирование — горизонтальное, через увеличение реплик в Kubernetes.
