5 параметров. 30 ходов диалога. Базовая настройка vs архитектура поведения. Оценщик независимый.
Я начал исследовать это после того, как несколько раз столкнулся с одной и той же проблемой на реальных проектах: агент работает хорошо в начале разговора и начинает «выпадать» из роли в длинных диалогах.
Меняет тон, нарушает ограничения, противоречит себе.
Реализована в продукте AI Behavior Engineering. Использую в собственных продуктах и у клиентов.
Разберём задачу, оценим что подходит. Первый разговор бесплатный.