Продукты / AI Behavior Engineering
Флагман · Live в production

AI Behavior
Engineering.

Агент, который не теряет себя
к третьему сообщению.

Drift cure 0/5 → 5/5
Из роли не выходит
Нарушения ограничений 0 из 50
01 · Проблема

Personality drift — поведение модели по умолчанию.

Вы настроили агента. Первые 20 сообщений — работает точно. Потом что-то меняется: тон стал другим, инструкции «забылись», ограничения нарушены.

Это не баг реализации. Это поведение модели по умолчанию: чем длиннее диалог, тем больше контекст вытесняет исходные инструкции.

Большинство команд патчат это одинаково: больше инструкций, строже промпт, перезапуск сессии. Ничего из этого не решает проблему архитектурно.

02 · Что я нашёл

Не «лучший промпт» — архитектура поведения.

Три года назад я начал строить агентов для реальных задач: клиентский сервис, продажи, диспетчеризация. Каждый раз натыкался на одну и ту же стену — агент устойчив в начале и разрушается в длинном диалоге.

Я исследовал эту задачу отдельно: что именно держит агента в роли через 30, 50, 100 сообщений.

Метрика
Без архитектуры
С AI Behavior Engineering
Устойчивость роли
0/5
5/5
Выход из роли
на 7–10 сообщении
не зафиксирован
Нарушение ограничений
систематически
0 из 50 диалогов
03 · Как работает

Не больше инструкций — меньше.

Пять точных правил держат поведение агента устойчивее, чем 200 строк системного промпта. Три компонента:

A

Ядро правил поведения

Неизменяемые правила, которые агент проверяет на каждом шаге. Работают независимо от длины диалога и содержания запроса.

B

Структура памяти

Оперативная (текущий диалог) + эпизодическая (история клиента) + семантическая (база знаний). Каждый слой загружается только когда нужен — не весь контекст сразу.

C

Детектор отклонений

Агент проверяет собственные ответы на соответствие роли до их отправки. Не после.

04 · Кейсы

В продакшене у реальных клиентов.

Автосервис

Санкт-Петербург
ИИ-диспетчер · 8 месяцев

Принимает звонки, квалифицирует заявки, назначает запись. До архитектуры: выходил из роли после ~80 сообщений, путал протокол, давал противоречивые цены.

После: стабилен на любой длине сессии. Протокол соблюдает точно. Персонал перестал проверять каждый второй диалог.

Контроль диалогов −70%
Длина сессии без drift 
Непрерывной работы 8 мес

ИИ-ассистент B2B-продаж

Первичные переговоры
квалификация лида · CRM

Вёл переговоры, отвечал на вопросы о продукте, передавал в CRM. Проблема: к третьей сессии с одним клиентом агент «забывал» предыдущие договорённости и начинал противоречить себе.

После архитектуры памяти + поведенческого ядра: 0 случаев потери контекста из 50 диалогов. Клиент получает последовательного агента, который помнит историю.

Потеря контекста 0 из 50
Противоречия себе устранены
05 · Для каких задач

Не universal fix — точечный инструмент.

Подходит

Где важно

  • Последовательность на длинных диалогах (клиентский сервис, продажи).
  • Соблюдение ограничений (нельзя давать цены, выходить за рамки темы).
  • Память об истории клиента (повторные обращения, ведение сделки).
  • Перенос поведения между моделями (Claude → GPT без потери характера).
Не подходит

Где не нужно

  • Одноразовые запросы.
  • Технические API-агенты без роли.
  • Задачи, где нет понятия «характер» или «роль».
06 · Статус
Live в production

Использую в собственных продуктах и у клиентов. Открытая часть — методология и результаты тестов. Подробности — в research/behavior.

Хотите внедрить в ваш продукт?

Разберём задачу, оценим что подходит и что нет. Первый разговор бесплатный.