Разработка ИИ

Разработка AI-агента под задачу вашего бизнеса

Создаём AI-агента, который автономно работает с клиентами и системами. От аудита до запуска — 3–5 недель.

От 250 000 ₽

стоимость разработки

3–5 недель

срок запуска

GPT-4LangChainPythonRAGFunction calling

Кейс «Продажи»: +4 млн ₽/мес после внедрения ИИ-ассистента — читать кейс

Процесс разработки

Аудит и цели

Что должен делать агент, какие KPI, где интегрируется.

Архитектура

Выбор модели (GPT-4/Claude/YandexGPT), фреймворка, базы знаний.

Разработка и интеграции

Подключаем API ваших систем, настраиваем инструменты.

Тестирование

Прогон 200+ сценариев, корректировка промптов.

Запуск

Деплой в облако, мониторинг, поддержка 30 дней.

Что входит в разработку

Промпт-инжиниринг

Тонкая настройка инструкций модели под ваши задачи.

RAG-архитектура

Векторная БД ваших документов для точных ответов.

Function calling

Подключение инструментов: API CRM, базы, календаря.

Память контекста

Долгосрочная память клиента между сессиями.

Мониторинг

Дашборды, алерты, A/B-тесты промптов.

DevOps и инфраструктура

Деплой в Яндекс.Облако/AWS, масштабирование.

Наши проекты

50+

проектов в продакшн

3 нед

средний срок

99.5%

uptime

80%

задач закрывает агент

Частые вопросы

GPT-4, Claude, YandexGPT, LangChain, Python, PostgreSQL+pgvector, Яндекс.Облако.

Да — Llama 3, Mistral в self-hosted режиме на ваших серверах.

200+ сценариев, A/B-тесты промптов, метрики точности и удовлетворённости.

30 дней бесплатной поддержки. Доработки в рамках ТЗ — бесплатно.

Да — после оплаты передаём код, документацию, инструкцию.

Чем AI-агент отличается от чат-бота

Чат-бот отвечает на сообщения. Агент — действует: ему доступны инструменты (function calling), и он сам решает, когда их применить. Пример различия: бот на вопрос «где мой заказ» ответит текстом из инструкции; агент сходит в API службы доставки, проверит статус конкретного заказа и вернёт клиенту трек-номер с датой. Если доставка задерживается — создаст тикет в поддержке без участия оператора.

Второе отличие — память и контекст. Агент помнит историю клиента между сессиями: прошлые заказы, предпочтения, незакрытые вопросы. Третье — работа с несколькими системами в одной задаче: прочитать письмо, извлечь данные, проверить их по базе, занести в CRM и уведомить ответственного — одна цепочка действий агента, а не пять ручных операций.

Типовые задачи, которые отдаём агентам

Квалификация и ведение входящих обращений: агент сам решает, ответить из базы знаний, уточнить детали или передать человеку — и доводит до записи или сделки. Обработка документов: извлечение данных из счетов, заявок и анкет с занесением в учётную систему. Операционный мониторинг: агент следит за метриками или почтовым ящиком и реагирует на события по регламенту.

Признак, что вам нужен именно агент, а не бот: задача требует обращения к вашим системам (CRM, 1С, календарь, склад) и принятия решений по правилам, а не только ответов на вопросы. Если же нужно отвечать клиентам по базе знаний — дешевле начать с чат-бота и доращивать его до агента по мере надобности.

Из чего складывается цена

База — от 250 000 ₽ за агента с одной-двумя интеграциями и RAG-базой знаний, срок 3–5 недель. Цену двигают три фактора: количество и сложность интеграций (штатные API дешевле, чем системы без документации), требования к надёжности (для критичных процессов — расширенное тестирование и сценарии отката) и выбор модели: облачные GPT-4 или YandexGPT против self-hosted Llama на ваших серверах, когда данные не должны покидать контур.

В стоимость входит прогон 200+ тестовых сценариев, деплой, мониторинг и 30 дней поддержки. ТЗ фиксирует целевые метрики — если они не достигнуты, дорабатываем без доплаты. Демо-агента на упрощённом сценарии показываем до подписания договора.

Как выбираем модель под задачу

Выбор модели — это компромисс между качеством, ценой и требованиями к данным. GPT-4 берём там, где нужна сильная логика на сложных цепочках действий. YandexGPT — когда важно держать данные в российском контуре и снизить стоимость токенов: для типовых клиентских диалогов его достаточно. Self-hosted Llama 3 или Mistral разворачиваем на ваших серверах, если политика безопасности запрещает облачные API вообще — так данные физически не покидают вашу инфраструктуру.

Модель — заменяемая деталь архитектуры: промпты, RAG-база и интеграции проектируются так, чтобы перейти с одной модели на другую без переписывания системы. Это страховка от изменения цен и доступности провайдеров.

Как устроена поддержка после запуска

Первые 30 дней после сдачи — включённая в стоимость поддержка: мы смотрим реальные диалоги и логи действий агента, правим промпты там, где он ведёт себя не так, как ожидалось, и дополняем базу знаний. Это штатная часть запуска: реальные пользователи всегда находят сценарии, которых не было в 200 тестовых.

Дальше — по выбору: передаём систему вашей команде с документацией и исходным кодом или продолжаем сопровождение по SLA. Мониторинг с алертами остаётся в любом случае: если агент начал отвечать дольше или чаще передавать диалоги людям, вы узнаете об этом из дашборда, а не от недовольного клиента.

Передача системы и владение кодом

Исходный код агента передаётся вам — это пункт договора, а не жест доброй воли. Вместе с кодом вы получаете документацию: архитектуру, схему интеграций, инструкции по изменению промптов и пополнению базы знаний. Ваша команда сможет развивать систему без нас — или с нами, по договору сопровождения, если своих инженеров нет.

Инфраструктура тоже ваша: деплоим в ваш аккаунт Яндекс.Облака или AWS, либо на ваши серверы. Это значит, что доступы, данные и расходы на модель — под вашим контролем с первого дня, и смена подрядчика не означает потерю системы.

Пример: как выглядит работа агента в продакшне

Входящее письмо от клиента с вложенной заявкой в Excel. Агент извлекает позиции, сверяет артикулы с номенклатурой в 1С, находит расхождение в двух строках — и сам пишет клиенту уточняющий вопрос. Получив ответ, создаёт заказ, ставит задачу логисту и отправляет клиенту подтверждение со сроками. Человек впервые видит эту заявку уже в виде готового заказа.

До агента эта цепочка занимала у менеджера 20–40 минут на заявку и регулярно ломалась на ручном переносе данных. Подобные конвейеры «письмо → система → ответ» — самый частый класс задач в наших 50+ проектах: они скучные для людей, дорогие в ошибках и идеально ложатся на агентскую архитектуру с function calling.

Когда агент — избыточное решение

Агентская архитектура не нужна, если задача сводится к ответам по базе знаний — с этим справляется чат-бот за вдвое меньшие деньги. Не нужна она и для разовых задач: писать агента ради операции, которая случается раз в месяц, экономически бессмысленно — порог окупаемости лежит в районе десятков повторений ежедневно.

Сомнительный кандидат — процесс с высокой ценой ошибки и без возможности проверки: например, безнадзорная отправка юридически значимых документов. Для таких задач мы строим агента в режиме «предложи — человек подтвердит»: рутина уходит машине, ответственность остаётся за сотрудником. Честная оценка применимости — часть бесплатного аудита, и иногда наш ответ — «вам это пока не нужно».