Блог PapAI Soft · Технологии

Как Claude считает мат в ваших запросах: что нашли в утечке 500 000 строк кода Anthropic

Anthropic случайно слила полмиллиона строк кода Claude. Внутри — счётчик матерных слов без ИИ, встроенный тамагочи и слои обработки, которые определяют, как ассистент отвечает именно вам.

Юрий Бутенков·06.04.2026·4 мин. чтения

Что произошло

На прошлой неделе Anthropic случайно опубликовала полмиллиона строк кода своего ИИ-агента Claude. Исследователи, конкуренты и просто любопытные разработчики получили редкую возможность заглянуть за кулисы одной из самых закрытых ИИ-компаний мира. Инженеры из OpenAI, DeepSeek и десятков других команд получили подарок от сильнейшего конкурента — детальное представление о том, как Anthropic строит продукт изнутри.

Важно сразу расставить точки над «и»: веса модели и «подкапотка» — основные параметры нейросети, которые и делают Claude тем, чем он является, — не утекли. Наружу вышел инженерный код — то, как компания использует модель, обрабатывает запросы, строит слои обработки и расставляет контекстные триггеры. Это как получить инструкцию по сборке автомобиля без чертежей двигателя: полезно, но не фатально для конкурентного преимущества.

Тем не менее находки оказались весьма неожиданными — особенно для тех, кто думал, что ИИ-ассистент работает как единая монолитная система.

500 000 строк кода — это объём кодовой базы среднего корпоративного продукта. Anthropic случайно сделала его публичным.

Встроенный тамагочи

Одна из самых неожиданных находок — встроенный тамагочи внутри системы Claude. Что именно он делает и как влияет на поведение ассистента, пока остаётся предметом анализа — исследователи продолжают разбирать кодовую базу. Но сам факт существования подобной системы говорит о многом: внутри Anthropic культивируется культура экспериментирования, где инженерам разрешено встраивать неочевидные механизмы в производственный код.

Это не баг и не случайность. Тамагочи присутствует в коде намеренно — что именно он отслеживает и какие состояния «воспроизводит», исследователи выяснят в ближайшие недели. Возможно, это внутренний инструмент мониторинга состояния сессии, возможно — что-то связанное с экспериментальными функциями. В любом случае это подтверждает: продукт, который пользователь видит, — лишь верхушка айсберга. Под ней — десятки слоёв логики, которые работают до того, как модель генерирует первое слово ответа.

Счётчик матершины — без ИИ

Главная находка, которую сразу подхватили технические СМИ: перед отправкой запроса к языковой модели Claude запускает отдельный модуль — счётчик ненормативной лексики. Он оценивает, как много и как «интенсивно» пользователь ругается в тексте запроса.

Словарь модуля включает конкретные выражения: wtf, omfg, dumbass, «piece of —», «this sucks» и ещё несколько десятков устойчивых конструкций раздражения и недовольства. Логика работы проста: модуль ищет совпадения по словарю, суммирует «вес» каждого выражения и передаёт итоговый балл тональности в контекст перед запросом к модели.

Никакого ИИ — обычный словарный поиск. ИИ-компания использует простейший алгоритм там, где сложный инструмент был бы избыточен.

И это правильное инженерное решение. Зачем гонять запрос через нейросеть, если можно сделать O(n) поиск по словарю за микросекунды? «Зачем лазер для стрельбы по воробьям» — именно этот принцип применяет Anthropic при проектировании системы. Результат счётчика влияет на реальное поведение Claude: система «понимает» уровень раздражения пользователя и адаптирует стиль ответа. Когда тональность запроса агрессивная, Claude меняет подход — становится более прямым, менее многословным, избегает дополнительных вопросов.

Это не эмпатия и не понимание — это детерминированная логика на основе словаря. Но результат с точки зрения пользователя выглядит именно как адаптация под настроение.

Что ещё нашли в коде

Помимо тамагочи и счётчика матершины, исследователи обнаружили несколько слоёв pre-processing, которые работают до отправки запроса к языковой модели. Классификаторы тематики, модераторы намерений, контекстные триггеры — всё это отдельные компоненты, которые формируют «контекстный пакет» перед вызовом основной модели.

Также в коде были обнаружены инструменты, которые на момент утечки ещё не были официально анонсированы. Это подтверждает: то, что пользователи видят в интерфейсе Claude, — лишь часть функциональности, которую Anthropic тестирует и готовит к выпуску.

Отдельного внимания заслуживают механизмы управления памятью сессии и структуры, отвечающие за передачу контекста между вызовами агента. Для компаний, которые строят на базе Claude сложные многошаговые системы, эти находки — ценный источник понимания ограничений и возможностей платформы.

Что это значит для бизнеса

Утечка кода Anthropic наглядно показывает то, что мы объясняем клиентам на каждом первом брифинге: разница между «просто подключить GPT» и настроенным ИИ-ассистентом измеряется именно количеством таких слоёв обработки.

Если вы внедряете ИИ-ассистент в бизнес-процессы, подобные механизмы — не экзотика, а стандарт. В PapAI Soft мы тоже строим слои pre-processing для каждого клиента: модерация входящих запросов, классификация тональности и намерений, контекстные триггеры, которые меняют поведение ассистента в зависимости от ситуации. Механика идентична тому, что Anthropic встраивает в Claude на уровне продукта.

Когда клиент пишет в поддержку раздражённо — ассистент получает сигнал и переключается в режим деэскалации: меньше вопросов, прямые предложения решений, приоритет скорости ответа. Когда запрос нейтральный и информационный — система работает в стандартном режиме с расширенными объяснениями. Разница в том, что у вас это настроено под вашу специфику, ваших клиентов и ваши бизнес-процессы — а не под абстрактного пользователя Claude.

Кстати, кейс внедрения ИИ-ассистента с подобными слоями обработки для B2B-продаж можно посмотреть на странице нашего продукта aisales. Там счётчик тональности — один из десяти компонентов системы.

Ключевые выводы

  • → Anthropic слила 500 000 строк кода — но не веса модели: конкурентное преимущество не утрачено
  • → Счётчик мата работает без ИИ: обычный словарный поиск за микросекунды
  • → Claude адаптирует стиль ответов в зависимости от тональности запроса — это детерминированная логика, не эмпатия
  • → Кастомизированный ИИ-ассистент отличается от «голого» API именно слоями pre-processing

Хотите настроить ИИ-ассистента с правильными слоями обработки под вашу задачу?

Мы строим системы с классификацией тональности, контекстными триггерами и логикой поведения — именно так, как это делает Anthropic внутри Claude, но под вашу специфику.

Как мы строим ИИ-ассистентов