logo

Превратите ИИ в индивидуальную систему выполнения задач: новейшее руководство Claude по передовым методам работы с управляемыми агентами

By: blockbeats|2026/04/09 18:00:03
0
Поделиться
copy
Оригинальное название статьи: Запуск управляемых агентов Claude
Автор оригинала: Лэнс Мартин
Перевод: Пегги, BlockBeats

Примечание редактора: В этой статье рассказывается об управляемых агентах, запущенных компанией Claude. Это представляет собой форму программного обеспечения, более близкую к будущему: интеллектуальные агенты больше не являются интерфейсами, которые реагируют на запросы однократно, а представляют собой системы выполнения, которые можно настраивать, развертывать, планировать и эксплуатировать в течение длительного времени.

Благодаря полному разделению «интеллекта» (модель и среда выполнения), «выполнения» (инструменты и песочница) и «процесса» (сессия и журнал), Claude Managed Agents превращают агент из «логики в коде» в независимую инфраструктурную единицу. Такая конструкция не только повышает стабильность и безопасность системы при выполнении длительных задач, но и позволяет агентам непрерывно расширяться по мере развития возможностей модели, не ограничиваясь существующими фреймворками.

В этих условиях изменились и типичные сценарии использования: от запуска по событию и по расписанию к автоматическому запуску «по факту доставки», а также к выполнению сложных задач, занимающих несколько дней или даже недель, — агенты действительно обретают способность «работать непрерывно». Это означает, что ценность ИИ больше не заключается только в качестве отдельного ответа, а в его способности накапливать и приумножать знания с течением времени.

Если предыдущие API позволяли разработчикам «задействовать интеллектуальные возможности», то теперь управляемые агенты пытаются ответить на другой вопрос: как превратить интеллектуальные возможности в систему, которую можно разместить на сервере, запланировать и запустить в режиме непрерывной работы. В этом смысле агенты уже не являются просто инструментами, а скорее представляют собой новый базовый элемент вычислительной системы.

Оригинальная статья гласит следующее:

ВКРАТЦЕ

Claude Managed Agents — это готовая к использованию и настраиваемая среда выполнения агентов (agent harness), которая работает на управляемой инфраструктуре. Достаточно лишь определить агент в качестве шаблона — включая инструменты, навыки, репозитории файлов и кода и т. д. — а остальные компоненты среды выполнения и инфраструктуры предоставляются системой. Эта система разработана с целью идти в ногу с быстро растущим уровнем интеллекта Клода и обеспечивать поддержку длительных задач.

Связанные ссылки:

·Блог Клода: Модели использования и примеры применения

·Блог по инженерии: Проектирование управляемых агентов Claude

·Документация: Руководство по началу работы, Краткое руководство, Обзор CLI и SDK

Управляемые агенты Claude

Почему нужны управляемые агенты Claude

API сообщений Claude по сути представляет собой точку входа для прямого взаимодействия с моделью: введите сообщение, получите блок контента. Интеллектуальные агенты, созданные на основе API сообщений, должны опираться на «среду выполнения» для управления маршрутизацией вызовов инструментов, управления контекстом и других задач. Однако это создаёт ряд проблем:

1. Среда выполнения должна идти в ногу с развивающимися возможностями Claude
Недавно я написал пост в блоге о том, как создать агента на основе встроенных возможностей API Claude для координации работы инструментов и управления контекстом. Однако проблема заключается в том, что среда выполнения агента зачастую предполагает наличие определённых ограничений в отношении того, «чего Клод не может сделать». По мере расширения возможностей Claude эти допущения быстро теряют актуальность и могут даже стать препятствиями для производительности. Поэтому среда выполнения должна постоянно обновляться, чтобы не отставать от темпов развития Claude.

2. Циклы выполнения задач у Клода становятся все длиннее
Спектр задач, с которыми может справиться Claude, растёт в геометрической прогрессии, превышая в тестах METR 10 часов человеческого труда. Это предъявляет более высокие требования к базовой инфраструктуре агента: она должна обеспечивать безопасность, стабильность при длительном функционировании (устойчивость к различным сбоям в работе инфраструктуры) и масштабируемость (например, поддержку одновременной работы нескольких групп агентов).

Цена --

--

Почему эти проблемы имеют значение

Решение вышеупомянутых задач имеет решающее значение, поскольку мы предполагаем, что будущие версии Claude смогут работать в непрерывном режиме в течение нескольких дней, недель или даже месяцев, занимаясь решением самых сложных проблем человечества.

SDK Claude Agent — это первый шаг в этом направлении, представляющий собой универсальную и удобную в использовании среду выполнения интеллектуальных агентов. Между тем, Claude Managed Agents идут ещё дальше: опираясь на эту основу, они предоставляют полноценную среду выполнения + управляемую инфраструктуру, специально разработанную для обеспечения безопасного и надёжного выполнения задач в течение длительного времени.

Начало работы

Простой способ начать работу — воспользоваться нашим навыком claude-api с открытым исходным кодом, который можно сразу же использовать в Claude Code. Просто установите последнюю версию Claude Code, а затем выполните следующую подкоманду, чтобы завершить настройку инициализации Claude Managed Agents.

Лично я отдаю явное предпочтение подходу, основанному на «навыках», при интеграции новых функций и широко применяю этот подход на практике.

Превратите ИИ в индивидуальную систему выполнения задач: новейшее руководство Claude по передовым методам работы с управляемыми агентами

Кроме того, вы можете ознакомиться с нашей документацией, чтобы быстро начать работу с SDK или CLI и создать прототипы своих агентов в консоли Claude.

Варианты использования

В официальном блоге Claude можно найти множество интересных примеров использования. Сопоставив эти примеры с собственным практическим опытом, я выявил несколько типичных моделей использования:

1. Срабатывающий по событию
Выполнение задачи управляемым агентом, запущенное службой.
Например, при обнаружении ошибки в системе автоматически отправляется запрос управляемому агенту с просьбой подготовить исправление и создать PR. Между этапами «обнаружение проблемы» и «установка исправления» не требуется никакого вмешательства со стороны человека.

2. Запланированное выполнение
Планирование задач для выполнения управляемым агентом.
Например, многие люди, в том числе и я, используют этот метод для создания ежедневных сводок (таких как краткий отчет о деятельности на платформе X или GitHub, либо отчет о проделанной работе команды, сгенерированный агентом). Ниже приведен пример моего ежедневного отчета о деятельности на платформе X.

3. «Запустил и забыл»
Выполнение задачи управляемым агентом, инициированное человеком, но не требующее дальнейшего контроля. Например, назначение задач управляемому агенту через Slack или Teams, после чего он самостоятельно выполняет задачу и предоставляет результаты (такие как таблицы, слайды или даже приложения).

4. Задачи с длительным сроком выполнения
Это долгосрочная задача, которую я считаю одним из особенно ценных сценариев для управляемых агентов.
Я провел ряд экспериментов на основе репозитория auto-research Андрея Карпати, исследуя различные способы его применения. Например, недавно я взял библиотеку _chenglou's pretext в качестве исходных данных и поручил управляемому агенту изучить, как применить её к контенту нашего технического блога.

Основные понятия

В процессе адаптации новых сотрудников необходимо понимать три основных понятия:

1. Агент
Конфигурация, управляемая системой контроля версий, которая определяет «идентичность» агента: включая модель, системный запрос, инструменты, навыки, сервер MCP и т. д. После создания его можно вызывать повторно по идентификатору.

2. Окружающая среда
Шаблон, используемый для описания тестовой среды, предоставляемой для работы инструмента-агента (например, тип среды выполнения, сетевая политика, конфигурация пакетов зависимостей и т. д.).

3. Сессия
Рабочий экземпляр с сохранением состояния, запущенный на основе предварительно настроенного агента и среды. Он создаст совершенно новую тестовую среду на основе шаблона, подключит ресурсы, необходимые для данного запуска (такие как файлы, репозитории GitHub), и надежно сохранит учетные данные в хранилище ключей (например, учетные данные MCP).

Можно представить это так:

· Агент = сама конфигурация

· Среда = Шаблон «песочницы», необходимый для работы агента

· Сессия = один конкретный процесс выполнения

Один агент может обслуживать несколько сеансов.

Использование

Подробности см. в документации. Общее использование подразделяется на две категории:

1. SDK (ориентированный на код)
Интегрируйте SDK в свое приложение, чтобы управлять сессиями во время выполнения. В настоящее время Managed Agents поддерживает 6 языков: Python, TypeScript, Java, Go, Ruby, PHP.

2. CLI (интерфейс командной строки)
Взаимодействуйте со всеми ресурсами API через командную строку, включая агенты, среды, сеансы, хранилища, навыки, файлы и т. д. Каждый тип ресурса имеет соответствующие подкоманды.

Распространенная практика:
Как правило, CLI используется для настройки и инициализации, а SDK — для реализации логики во время выполнения.
Шаблон агента является постоянным: вы можете создать шаблон (например, определив модель, системный запрос, инструменты, сервер MCP и навыки в формате YAML), сохранить его в Git и применить во время развертывания с помощью командной строки.

Рабочий процесс

Я стал соавтором поста в блоге Anthropic Engineering вместе с @mc_anthropic, @gcemaj и @jkeatn, в котором подробно описано устройство управляемых агентов Claude. Один из ключевых выводов статьи заключался в том, что обеспечение возможности масштабирования агентов в соответствии с уровнем интеллекта Claude по сути является «проблемой инфраструктуры», а не просто вопросом проектирования среды выполнения.

Это означает, что настоящая задача заключается не в том, «как создать более умного агента», а в том, как построить систему, способную стабильно функционировать в долгосрочной перспективе, быть масштабируемой и развивающейся, что позволит агенту выполнять все более сложные и долгосрочные задачи.

Исходя из этой философии, мы не разрабатывали фиксированную среду выполнения агентов (harness), поскольку предполагали, что она did-133">будет постоянно развиваться. Вместо этого мы «разделили» несколько ключевых компонентов системы:

«Brain» (Claude и его среда выполнения)

«Руки» (песочница и инструмент, выполняющий конкретные действия)

«Сессия» (записывает журналы событий выполнения)

Эти три интерфейса были разработаны как независимые, с минимальными допущениями относительно друг друга. Каждая деталь может выйти из строя или быть заменена независимо от остальных, не влияя на работу системы в целом.

В статье мы также рассказали о том, как эта архитектура обеспечивает более высокую надёжность, безопасность и гибкость, оставляя при этом возможность для будущей интеграции новых сред выполнения, песочниц или инфраструктуры для хостинга сеансов.

Заключение

Мне очень интересны проекты, посвящённые координации действий множества агентов или задачам с длительным сроком реализации. Одна вещь, которая всегда вызывала у меня разочарование в прошлом, — это то, как среда выполнения агента с трудом поспевает за развивающимися возможностями модели.

Значение Claude Managed Agents заключается в том, что этот сервис берет на себя управление средой выполнения и инфраструктурным уровнем, позволяя вам сосредоточиться на более высоком уровне — рассматривая сам «агент» как новый базовый элемент в API Claude, что открывает возможности для дальнейших исследований и разработок на его основе.

[Ссылка на исходный пост]

Вам также может понравиться

Макроэкономический анализ рынка криптовалют: Прекращение огня между США и Ираном, время переоценить рисковые активы

Как прекращение огня между США и Ираном влияет на рисковые активы?

Стейблкоины достигли 315 миллиардов долларов в 2026 году: Почему это самая большая тенденция в криптовалюте прямо сейчас

Биткойн может формировать свое дно 2026 года около 65 тысяч долларов. Посмотрите, как тарифные шоки, притоки ETF и геополитические сигналы могут сформировать следующий прорыв BTC к 75 тысячам долларов.

Формирует ли Биткойн дно в 2026 году? Как тарифный шок и прекращение огня могут подтолкнуть BTC к $75K

Биткойн может формировать свое дно 2026 года около $65K. Узнайте, как тарифные шоки, приток средств в ETF и прекращение огня в Иране могут повлиять на следующий рывок BTC к $75K.

Исследование Тигра: Комплексный анализ наиболее прибыльных бизнесов и их бизнес-моделей в области криптовалют

Плата за платежи, общая инфраструктура и офшорный спрос стали новыми полем битвы.

Почему перемирие между США и Ираном обречено на несостоятельность?

Глубокий анализ: Почему перемирие между США и Ираном критикуется как "номинальное"? Когда обе стороны привыкли ставить свою власть выше соглашений, этот краткий мир, лишенный доверия, обречен стать лишь руинами.

Начиная с мира криптовалют, что делает Hermes Agent самым серьезным конкурентом OpenClaw?

Две кривые роста растут одновременно, но то, что растет, совершенно разное.

Популярные монеты

Последние новости криптовалют

Еще