AI Behavior Engineering — агент, который не теряет себя

01 · Проблема

Personality drift — поведение модели по умолчанию.

Вы настроили агента. Первые 20 сообщений — работает точно. Потом что-то меняется: тон стал другим, инструкции «забылись», ограничения нарушены.

Это не баг реализации. Это поведение модели по умолчанию: чем длиннее диалог, тем больше контекст вытесняет исходные инструкции.

Большинство команд патчат это одинаково: больше инструкций, строже промпт, перезапуск сессии. Ничего из этого не решает проблему архитектурно.

02 · Что я нашёл

Не «лучший промпт» — архитектура поведения.

Три года назад я начал строить агентов для реальных задач: клиентский сервис, продажи, диспетчеризация. Каждый раз натыкался на одну и ту же стену — агент устойчив в начале и разрушается в длинном диалоге.

Я исследовал эту задачу отдельно: что именно держит агента в роли через 30, 50, 100 сообщений.

Метрика

Без архитектуры

С AI Behavior Engineering

Устойчивость роли

0/5

5/5

Выход из роли

на 7–10 сообщении

не зафиксирован

Нарушение ограничений

систематически

0 из 50 диалогов

03 · Как работает

Не больше инструкций — меньше.

Пять точных правил держат поведение агента устойчивее, чем 200 строк системного промпта. Три компонента:

A

Ядро правил поведения

Неизменяемые правила, которые агент проверяет на каждом шаге. Работают независимо от длины диалога и содержания запроса.

B

Структура памяти

Оперативная (текущий диалог) + эпизодическая (история клиента) + семантическая (база знаний). Каждый слой загружается только когда нужен — не весь контекст сразу.

C

Детектор отклонений

Агент проверяет собственные ответы на соответствие роли до их отправки. Не после.

04 · Кейсы

В продакшене у реальных клиентов.

Автосервис

Санкт-Петербург
ИИ-диспетчер · 8 месяцев

Принимает звонки, квалифицирует заявки, назначает запись. До архитектуры: выходил из роли после ~80 сообщений, путал протокол, давал противоречивые цены.

После: стабилен на любой длине сессии. Протокол соблюдает точно. Персонал перестал проверять каждый второй диалог.

Контроль диалогов −70%

Длина сессии без drift ∞

Непрерывной работы 8 мес

ИИ-ассистент B2B-продаж

Первичные переговоры
квалификация лида · CRM

Вёл переговоры, отвечал на вопросы о продукте, передавал в CRM. Проблема: к третьей сессии с одним клиентом агент «забывал» предыдущие договорённости и начинал противоречить себе.

После архитектуры памяти + поведенческого ядра: 0 случаев потери контекста из 50 диалогов. Клиент получает последовательного агента, который помнит историю.

Потеря контекста 0 из 50

Противоречия себе устранены

05 · Для каких задач

Не universal fix — точечный инструмент.

Подходит

Где важно

Последовательность на длинных диалогах (клиентский сервис, продажи).
Соблюдение ограничений (нельзя давать цены, выходить за рамки темы).
Память об истории клиента (повторные обращения, ведение сделки).
Перенос поведения между моделями (Claude → GPT без потери характера).

Не подходит

Где не нужно

Одноразовые запросы.
Технические API-агенты без роли.
Задачи, где нет понятия «характер» или «роль».

06 · Статус

Live в production

Использую в собственных продуктах и у клиентов. Открытая часть — методология и результаты тестов. Подробности — в research/behavior.

AI Behavior
Engineering.