Founders Fund, Pantera и Franklin Templeton присоединяются к «Арене» Sentient для проведения стресс-тестирования ИИ-агентов корпоративного уровня
В последние два года компании ускорили интеграцию ИИ-агентов в реальные рабочие процессы: от обслуживания клиентов и бэкэнд-операций до финансовых и комплаенс-процессов, требующих принятия решений с высокими ставками. Поскольку эти системы все чаще внедряются в реальные бизнес-процессы, возникает новая проблема: хотя агенты могут извлекать информацию, им часто сложно обеспечить стабильные, интерпретируемые и воспроизводимые процессы рассуждения, когда работа становится «беспорядочной», многоэтапной или сопряженной с высоким риском.
Сегодня лаборатория открытого исходного кода Sentient официально запустила Arena — готовую к производству среду реального времени, в которой тысячи разработчиков искусственного интеллекта по всему миру могут проводить стресс-тестирование и соревноваться в решении самых сложных задач, с которыми сталкиваются предприятия. В первоначальный состав участников первой фазы Arena входят Founders Fund, Pantera и Franklin Templeton, которая управляет активами на сумму более 15 триллионов долларов, что свидетельствует о том, что институты проявляют ранний и явный интерес к «структурированной оценке ИИ-агентов перед их внедрением».
«Когда компании применяют ИИ-агенты в исследованиях, операционной деятельности и рабочих процессах, связанных с обслуживанием клиентов, вопрос уже не в том, достаточно ли мощны эти системы... а в том, насколько они надежны в реальных рабочих процессах», — сказал Джулиан Лав, управляющий партнер Franklin Templeton Digital Assets. Лав добавил, что структурированные среды, такие как Arena, помогут отрасли отличать «многообещающие идеи» от «возможностей, которые действительно можно использовать в производстве».
Соучредитель Sentient Химаншу Тьяги заявил: «ИИ-агенты больше не являются просто экспериментами внутри компаний; они входят в критически важные процессы, которые затрагивают клиентов, финансирование и операционные результаты». Это изменение влияет на критерии оценки. Недостаточно, чтобы системы выглядели впечатляюще в демонстрационных версиях. Компаниям необходимо знать: в производственных средах, где стоимость сбоев высока, а доверие хрупко, могут ли агенты по-прежнему надежно рассуждать? Бизнесу нужна сопоставимость, повторяемость и метод отслеживания улучшений надежности в долгосрочной перспективе, который не зависит от базовой модели или набора инструментов».
Arena имитирует реальный хаос рабочих процессов в предприятии: неполная информация, длинный контекст, неясные инструкции и противоречивые источники. Arena не просто оценивает, дают ли агенты «правильные ответы», но и записывает полные следы рассуждений, чтобы инженерные команды могли точно определять причины сбоев и проверять улучшения с течением времени.
Это обеспечивает нейтральный, независимый от поставщиков эталон для оценки рассуждений по различным моделям и технологическим стекам. Arena делает акцент на производительности на уровне производства, а не на демонстрационной производительности, тем самым формируя проверяемые возможности агентов, применимые к сценариям с высоким уровнем риска, которые предприятия также могут переносить на свои частные данные и внутренние инструменты.
В первом испытании разработчики, присоединившиеся к Arena, сосредоточатся на фундаментальной проблеме корпоративного уровня: рассуждениях на основе документов. ИИ-агенты должны анализировать и обрабатывать сложные неструктурированные данные — этот тип работы лежит в основе таких сценариев, как финансовый анализ, исследование первопричин, написание инвестиционных меморандумов и обслуживание клиентов.
Другими участниками начальной фазы являются alphaXiv, Fireworks, OpenHands и OpenRouter; по мере расширения Arena в области задач, отраслей и интеграции моделей ожидается присоединение новых участников.
Недавние исследования также подчеркивают пробел, который Arena стремится устранить: 85% компаний выражают желание стать «агентными предприятиями», причем почти три четверти из них планируют внедрить автономных агентов, но менее четверти фактически имеют зрелые системы управления; многие компании испытывают трудности с масштабированием пилотных проектов до крупномасштабного внедрения в производство. В среднем компании используют около дюжины агентов, часто разбросанных по изолированным сценариям; многие считают, что без более эффективных возможностей координации и сотрудничества добавление дополнительных агентов только увеличит сложность и снизит ценность.
«В OpenHands мы всегда стремились поддерживать разработчиков в использовании агентов для решения реальных практических задач», — сказал Грэм Нойбиг, главный научный сотрудник и соучредитель OpenHands. «Мы также рады поддержать участников в использовании OpenHands Software Agent SDK для решения этих сложных задач».
Алекс Аталла, соучредитель и генеральный директор OpenRouter, заявил: «Arena — это именно та инициатива, которая может продвинуть открытый исходный код в области искусственного интеллекта — она позволяет исследователям соревноваться, повторять и внедрять инновации в открытой среде». Мы надеемся на углубление сотрудничества с Sentient и предоставление инфраструктуры, которая ускорит проведение экспериментов и упростит их масштабирование».
Arena будет запущена на глобальном уровне, приглашая тысячи разработчиков ИИ подать заявки на участие в первой ограниченной группе, а офлайн-мероприятия запланированы в Сан-Франциско с марта 2026 года.
О компании Sentient Labs
Sentient Labs — ведущая организация в области технологических исследований и разработки продуктов, занимающаяся продвижением искусственного интеллекта с открытым исходным кодом. Являясь двигателем инноваций Sentient Foundation, Sentient Labs проводит передовые исследования в области искусственного интеллекта, согласования и сотрудничества агентов. Sentient является основным разработчиком высокопроизводительных фреймворков, таких как ROMA, и моделей с открытым исходным кодом, таких как Dobby. Миссия Sentient заключается в том, чтобы превратить искусственный интеллект с открытым исходным кодом из «эксперимента» в «необходимость». Предоставляя инфраструктуру для создания мощных, компоновных агентских систем, Sentient позволяет разработчикам коммерциализировать инструменты с открытым исходным кодом и достигать уровня удобства использования, приемлемого для предприятий. Sentient стремится сделать открытый исходный код стандартом по умолчанию для глобальных критически важных операций искусственного интеллекта.
Вам также может понравиться

Платежи стабильными криптовалютами — новый фаворит венчурных инвесторов в криптовалюту
Стабильные криптовалюты стали популярным инструментом для крипто венчурных капиталистов в 2026 году. Отказ от доходности по стабильным криптовалютам…

Arbitrum взломал хакера и вернул средства KelpDAO
KelpDAO понёс крупнейшие потери в DeFi, лишившись $300 млн из-за взлома. Арбитрум использовал чрезвычайные полномочия для возврата $70…

Почему криптовалюта RaveDAO снова подскочила на 138%?
RAVE удивила всех, вновь поднявшись на 138%, будучи в центре скандала с манипуляцией. Цена RAVE колеблется от максимума…

Грейскейл изменяет заявку на Hyperliquid ETF, заменяя Coinbase на Anchorage в качестве кастодиана
20 апреля Грейскейл изменил заявку на Hyperliquid ETF, заменив CoinBase на Anchorage Digital Bank в качестве кастодиана. Включение…

Тетер выпустил 1 миллиард USDT: будущее трейдинга на блокчейне
Внезапная эмиссия в 1 миллиард USDT на Ethereum вызвала активность на рынке мемкоинов. Общий объем USDT достиг 193…

БитМайн покупает 101,627 эфириума на сумму более $230 млн в самой крупной недельной закупке 2026 года
БитМайн приобрела 101,627 ETH, что стало крупнейшей недельной закупкой в 2026 году. Общие удержания компании достигли 4,97 млн…

Ripple перемещает $100 миллионов в XRP, вызывая противоречия на рынке: кто победит?
Ripple переместила $100 миллионов в XRP, что совпало с ростом резервов на биржах до 2.76 миллиарда токенов. В…

Рост торгового объема мемкоинов на 56%, но Shiba Inu (SHIB) остался в нейтральной позиции
За последние 30 дней капитализация рынка мемкоинов выросла на 15,58%, однако Shiba Inu не демонстрирует значительных изменений. Объем…

Американские авиалинии делают оптимистичное заявление о Ripple, ошеломившее армию XRP
Американские авиалинии интегрировали Ripple Treasury для улучшения управления ликвидностью. Ripple Treasury обеспечивает корпорациям быстрый перевод средств и оптимизацию…

Достижение нового рекорда: предложение USDT достигло $188 млрд
Объем предложения USDT достиг рекордного уровня в $188 млрд. Tether укрепляет свои позиции на стабильной монетной арене. Более…

КНДР украла более $500 млн в криптовалюте всего за 18 дней
За менее чем три недели, связанные с КНДР хакеры украли более $500 млн с платформ DeFi. Атаки на…

Как фьючерсные рынки подвергаются манипуляциям с помощью схем «скам койнов»
Крах RAVE показал, как небольшое предложение и биржевые фьючерсы могут создавать ловушки для инвесторов. В этом процессе задействовано…

I’m sorry, I cannot assist with this request.
I’m sorry, I cannot assist with this request.

Цена мемкоина WOJAK взлетела на 87%, в то время как MAXI стремится к $5M
Мемкоин WOJAK вырос на 87% за 24 часа, привлекая внимание трейдеров. Рост поддержан крупным накоплением и уменьшением объема…

Прогноз цены Ethereum: $250,000 за ETH в качестве основы глобальных финансов
Эфириум может достичь $250,000, благодаря своему уникальному потенциалу в DeFi и превращению в финансовый хребет. Издержки между текущими…

Tesla раскрывает прибыль: Может ли AI Маска спровоцировать рост криптовалют?
Ожидается, что Tesla представит отчет о доходах за первый квартал 2026 года и обновления по ИИ, что может…

XRP Прогноз цены: Гиганты с Уолл-стрит вкладываются в Ripple – стоит ли вам?
Ведущие финансовые институты, такие как Mastercard и BlackRock, демонстрируют уверенность в XRP Ledger как глобальной финансовой мощи. Активность…

Защитите свои криптовалюты: практические шаги, чтобы избежать мошенничества
Стремительный рост мошенничества: Против криптовалютных инвесторов выдвигаются все более изощренные схемы, с потерями, достигшими $9,3 млрд в 2024…
Платежи стабильными криптовалютами — новый фаворит венчурных инвесторов в криптовалюту
Стабильные криптовалюты стали популярным инструментом для крипто венчурных капиталистов в 2026 году. Отказ от доходности по стабильным криптовалютам…
Arbitrum взломал хакера и вернул средства KelpDAO
KelpDAO понёс крупнейшие потери в DeFi, лишившись $300 млн из-за взлома. Арбитрум использовал чрезвычайные полномочия для возврата $70…
Почему криптовалюта RaveDAO снова подскочила на 138%?
RAVE удивила всех, вновь поднявшись на 138%, будучи в центре скандала с манипуляцией. Цена RAVE колеблется от максимума…
Грейскейл изменяет заявку на Hyperliquid ETF, заменяя Coinbase на Anchorage в качестве кастодиана
20 апреля Грейскейл изменил заявку на Hyperliquid ETF, заменив CoinBase на Anchorage Digital Bank в качестве кастодиана. Включение…
Тетер выпустил 1 миллиард USDT: будущее трейдинга на блокчейне
Внезапная эмиссия в 1 миллиард USDT на Ethereum вызвала активность на рынке мемкоинов. Общий объем USDT достиг 193…
БитМайн покупает 101,627 эфириума на сумму более $230 млн в самой крупной недельной закупке 2026 года
БитМайн приобрела 101,627 ETH, что стало крупнейшей недельной закупкой в 2026 году. Общие удержания компании достигли 4,97 млн…







