Промпт-инжиниринг

Промпт-инжиниринг — разработка текстовых инструкций, которые передаются языковой модели для управления её поведением. Грамотный промпт определяет роль модели, задаёт формат ответа, ограничивает область знаний и задаёт тон общения — без какого-либо переобучения модели.

Системный промпт

Системный промпт — это скрытая инструкция, которую видит модель, но не видит пользователь. В нём задаётся роль («Ты — консультант по продажам интернет-магазина»), ограничения («Не отвечай на вопросы, не связанные с ассортиментом»), формат («Отвечай кратко, не более 3 предложений»). Изменение системного промпта — самый быстрый способ скорректировать поведение бота без технических изменений.

Few-shot промптинг

Few-shot — техника, при которой в промпт включают 3–10 примеров «вопрос → правильный ответ». Модель улавливает паттерн и воспроизводит его для новых запросов. Например, для бота, классифицирующего обращения клиентов, достаточно 5–7 примеров с метками (жалоба, запрос, комплимент), чтобы модель правильно размечала остальные.

Для бота цветочной сети 12 примеров в few-shot блоке подняли точность классификации намерения с 71% до 94% без переобучения модели. Читать кейс.

Chain-of-thought (CoT)

Chain-of-thought — техника, при которой модель просят рассуждать пошагово перед тем, как дать ответ. Фраза «думай шаг за шагом» или пример пошагового рассуждения в few-shot блоке значительно улучшает точность на задачах, требующих логики: расчёт цены, выбор из вариантов, проверка условий. На простых задачах CoT не нужен — он лишь увеличивает расход токенов.

Как промпт влияет на стоимость

Длинный системный промпт (1 500–3 000 токенов) напрямую увеличивает стоимость каждого вызова API. При 1 000 запросов в день промпт в 2 000 токенов добавляет 2 000 000 входящих токенов в сутки — при цене GPT-4 около $10 за 1 млн токенов это $20/сутки только на промпт. Кешировать промпт (Anthropic prompt caching) или использовать модель меньшего размера для фильтрации — стандартная оптимизация.

Связанные термины

  • LLM — модель, которую настраивает промпт
  • RAG — как промпт сочетается с поиском по документам
  • Fine-tuning — альтернатива промпту для глубокого изменения поведения
  • Контекстное окно — ограничение, в которое должен уложиться промпт

Хотите настроить промпты для вашего бота? Обсудим задачу.

Связаться с нами