Потребность максимизировать производительность и пользовательский опыт ведет к разработке адаптивного мышления Клода

Связка 1

Начальное состояние: Модели рассуждения следовали строгому шаблону: сначала мышление, затем вызов инструментов, затем текст; это ограничивало гибкость и последовательность действий
Преобразование: Разработка и внедрение адаптивного мышления — режима, в котором Claude может думать, использовать инструменты и генерировать текст в любом порядке, без обязательного начального блока мышления, подстраиваясь под требования задачи
Конечное состояние: Claude получил возможность думать на каждом этапе процесса, что максимизирует производительность (наравне с перемежающимся мышлением или лучше) и улучшает пользовательский опыт

Итак, учитывая настройки усилий пользователя и потенциальное ограничение бюджета, как Claude распределяет токены между мышлением, вызовом инструментов и текстом, чтобы максимизировать свою производительность и пользовательский опыт?

Когда модели рассуждения были впервые представлены, они следовали очень конкретному шаблону в том, как тратить эти токены. Первое, что они делали, — это думали и тратили эти токены мышления на проработку проблемы. А затем они переходили к вызову инструментов. И, наконец, к тексту.

Мы улучшили это, когда представили перемежающееся мышление, которое позволило Claude использовать мышление и рассуждение между вызовами инструментов. В этом режиме Claude мог вызвать инструмент, получить результат, обдумать этот результат, затем определить, что вызвать следующим, и так далее, пока не решит дать окончательный ответ.

Недавно мы запустили адаптивное мышление. И адаптивное мышление — это следующая эволюция поверх перемежающегося мышления. В этой новой парадигме Claude может думать, когда это уместно. На самом деле нет никаких ограничений на то, когда Claude нужно думать, сколько ему нужно думать или в каком порядке тратить любые из этих токенов. Он может использовать мышление, использование инструментов и текст в любом порядке, необходимом для наилучшего соответствия требованиям вашей задачи.

Claude может решить начать с текстового ответа, чтобы подтвердить запрос пользователя. Он может остановиться, чтобы вызвать инструмент. Затем он может обдумать этот инструмент, ответить пользователю, чтобы дать обновление, продолжить вызывать инструменты и так далее, пока не предоставит окончательный ответ о проделанной работе.

[...]

Разница между вашим мышлением при низких и высоких усилиях может быть весьма значительной.

Адаптивное мышление — это не маршрутизатор моделей и не автоматический переключатель мышления. То есть оно не берет ваш запрос, не классифицирует его по сложности и не решает, использовать ли версию модели с мышлением или без. Скорее, это разница между указанием Клоду «ты должен потратить хотя бы один токен мышления в начале этого ответа» и указанием «ты можешь тратить токены мышления когда угодно и сколько нужно для решения этой задачи».

Суть в том, что у Клода есть возможность думать на каждом этапе процесса. Мы запускаем все наши бенчмарки на адаптивном мышлении, начиная с Opus 4.6, и это действительно наш режим, максимизирующий интеллект, который показывает производительность на уровне или лучше, чем перемежающееся мышление, обеспечивая при этом лучший пользовательский опыт.

Итак, я хочу немного подробнее остановиться на усилиях и противопоставить их тому, как мы использовали мышление в прошлом. Исторически пользователи использовали переключатели мышления во многом как регулятор усилий. То есть, если вы хотели, чтобы Клод тратил больше времени на решение задачи, вы могли включить мышление в claude.ai или Claude Code и ожидать, что он потратит больше времени, чтобы дать вам лучший результат.

Это довольно разумный инстинкт. Однако переключатели мышления — это довольно плохой заменитель регулятора усилий. Вместо того чтобы выражать, насколько усердно вы хотите, чтобы Клод работал, вы на самом деле включаете и выключаете действительно ключевую способность модели. Вы ограничиваете то, как ей разрешено работать, а не то, насколько усердно вы хотите, чтобы она работала. Регулятор усилий гораздо лучше выражает идею «потрать больше токенов, чтобы получить лучший ответ». Он перемещает мышление, использование инструментов и вывод текста вместе, а не просто переключает один из них.

В качестве аналогии с использованием инструментов: мы не говорим Клоду всегда искать или никогда не искать. Мы говорим Клоду выяснить, когда следует искать, исходя из текущей задачи, и именно это позволяет Клоду быть агентным в ответ на ваш запрос. Аналогичным образом, когда мы работаем со всеми нашими коллегами, мы не просим их включать и выключать свой внутренний монолог в ответ на вопрос. Мы спрашиваем их, насколько усердно стараться, и тогда наши коллеги решают, насколько усердно они будут думать над этой проблемой и какие действия предпримут в ответ.

Видео-источник

Потребность максимизировать производительность и пользовательский опыт ведет к разработке адаптивного мышления Клода

Связка 1