Разработка ИИ
Разработка AI-агента под задачу вашего бизнеса
Создаём AI-агента, который автономно работает с клиентами и системами. От аудита до запуска — 3–5 недель.
Кейс «Продажи»: +4 млн ₽/мес после внедрения ИИ-ассистента — читать кейс
Процесс разработки
Аудит и цели
Что должен делать агент, какие KPI, где интегрируется.
Архитектура
Выбор модели (GPT-4/Claude/YandexGPT), фреймворка, базы знаний.
Разработка и интеграции
Подключаем API ваших систем, настраиваем инструменты.
Тестирование
Прогон 200+ сценариев, корректировка промптов.
Запуск
Деплой в облако, мониторинг, поддержка 30 дней.
Что входит в разработку
Тонкая настройка инструкций модели под ваши задачи.
RAG-архитектура
Векторная БД ваших документов для точных ответов.
Function calling
Подключение инструментов: API CRM, базы, календаря.
Память контекста
Долгосрочная память клиента между сессиями.
Мониторинг
Дашборды, алерты, A/B-тесты промптов.
DevOps и инфраструктура
Деплой в Яндекс.Облако/AWS, масштабирование.
Наши проекты
Частые вопросы
GPT-4, Claude, YandexGPT, LangChain, Python, PostgreSQL+pgvector, Яндекс.Облако.
Да — Llama 3, Mistral в self-hosted режиме на ваших серверах.
200+ сценариев, A/B-тесты промптов, метрики точности и удовлетворённости.
30 дней бесплатной поддержки. Доработки в рамках ТЗ — бесплатно.
Да — после оплаты передаём код, документацию, инструкцию.
Чем AI-агент отличается от чат-бота
Чат-бот отвечает на сообщения. Агент — действует: ему доступны инструменты (function calling), и он сам решает, когда их применить. Пример различия: бот на вопрос «где мой заказ» ответит текстом из инструкции; агент сходит в API службы доставки, проверит статус конкретного заказа и вернёт клиенту трек-номер с датой. Если доставка задерживается — создаст тикет в поддержке без участия оператора.
Второе отличие — память и контекст. Агент помнит историю клиента между сессиями: прошлые заказы, предпочтения, незакрытые вопросы. Третье — работа с несколькими системами в одной задаче: прочитать письмо, извлечь данные, проверить их по базе, занести в CRM и уведомить ответственного — одна цепочка действий агента, а не пять ручных операций.
Типовые задачи, которые отдаём агентам
Квалификация и ведение входящих обращений: агент сам решает, ответить из базы знаний, уточнить детали или передать человеку — и доводит до записи или сделки. Обработка документов: извлечение данных из счетов, заявок и анкет с занесением в учётную систему. Операционный мониторинг: агент следит за метриками или почтовым ящиком и реагирует на события по регламенту.
Признак, что вам нужен именно агент, а не бот: задача требует обращения к вашим системам (CRM, 1С, календарь, склад) и принятия решений по правилам, а не только ответов на вопросы. Если же нужно отвечать клиентам по базе знаний — дешевле начать с чат-бота и доращивать его до агента по мере надобности.
Из чего складывается цена
База — от 250 000 ₽ за агента с одной-двумя интеграциями и RAG-базой знаний, срок 3–5 недель. Цену двигают три фактора: количество и сложность интеграций (штатные API дешевле, чем системы без документации), требования к надёжности (для критичных процессов — расширенное тестирование и сценарии отката) и выбор модели: облачные GPT-4 или YandexGPT против self-hosted Llama на ваших серверах, когда данные не должны покидать контур.
В стоимость входит прогон 200+ тестовых сценариев, деплой, мониторинг и 30 дней поддержки. ТЗ фиксирует целевые метрики — если они не достигнуты, дорабатываем без доплаты. Демо-агента на упрощённом сценарии показываем до подписания договора.
Как выбираем модель под задачу
Выбор модели — это компромисс между качеством, ценой и требованиями к данным. GPT-4 берём там, где нужна сильная логика на сложных цепочках действий. YandexGPT — когда важно держать данные в российском контуре и снизить стоимость токенов: для типовых клиентских диалогов его достаточно. Self-hosted Llama 3 или Mistral разворачиваем на ваших серверах, если политика безопасности запрещает облачные API вообще — так данные физически не покидают вашу инфраструктуру.
Модель — заменяемая деталь архитектуры: промпты, RAG-база и интеграции проектируются так, чтобы перейти с одной модели на другую без переписывания системы. Это страховка от изменения цен и доступности провайдеров.
Как устроена поддержка после запуска
Первые 30 дней после сдачи — включённая в стоимость поддержка: мы смотрим реальные диалоги и логи действий агента, правим промпты там, где он ведёт себя не так, как ожидалось, и дополняем базу знаний. Это штатная часть запуска: реальные пользователи всегда находят сценарии, которых не было в 200 тестовых.
Дальше — по выбору: передаём систему вашей команде с документацией и исходным кодом или продолжаем сопровождение по SLA. Мониторинг с алертами остаётся в любом случае: если агент начал отвечать дольше или чаще передавать диалоги людям, вы узнаете об этом из дашборда, а не от недовольного клиента.
Передача системы и владение кодом
Исходный код агента передаётся вам — это пункт договора, а не жест доброй воли. Вместе с кодом вы получаете документацию: архитектуру, схему интеграций, инструкции по изменению промптов и пополнению базы знаний. Ваша команда сможет развивать систему без нас — или с нами, по договору сопровождения, если своих инженеров нет.
Инфраструктура тоже ваша: деплоим в ваш аккаунт Яндекс.Облака или AWS, либо на ваши серверы. Это значит, что доступы, данные и расходы на модель — под вашим контролем с первого дня, и смена подрядчика не означает потерю системы.
Пример: как выглядит работа агента в продакшне
Входящее письмо от клиента с вложенной заявкой в Excel. Агент извлекает позиции, сверяет артикулы с номенклатурой в 1С, находит расхождение в двух строках — и сам пишет клиенту уточняющий вопрос. Получив ответ, создаёт заказ, ставит задачу логисту и отправляет клиенту подтверждение со сроками. Человек впервые видит эту заявку уже в виде готового заказа.
До агента эта цепочка занимала у менеджера 20–40 минут на заявку и регулярно ломалась на ручном переносе данных. Подобные конвейеры «письмо → система → ответ» — самый частый класс задач в наших 50+ проектах: они скучные для людей, дорогие в ошибках и идеально ложатся на агентскую архитектуру с function calling.
Когда агент — избыточное решение
Агентская архитектура не нужна, если задача сводится к ответам по базе знаний — с этим справляется чат-бот за вдвое меньшие деньги. Не нужна она и для разовых задач: писать агента ради операции, которая случается раз в месяц, экономически бессмысленно — порог окупаемости лежит в районе десятков повторений ежедневно.
Сомнительный кандидат — процесс с высокой ценой ошибки и без возможности проверки: например, безнадзорная отправка юридически значимых документов. Для таких задач мы строим агента в режиме «предложи — человек подтвердит»: рутина уходит машине, ответственность остаётся за сотрудником. Честная оценка применимости — часть бесплатного аудита, и иногда наш ответ — «вам это пока не нужно».
