Боитесь открыть ящик Пандоры? Самая мощная модель Anthropic никогда не будет раскрыта
Кодовая база OpenBSD имеет уязвимость, существующую уже 27 лет. В FFmpeg есть уязвимость, существующая 16 лет, и этот сегмент кода вызывался более 5 миллионов раз до того, как был обнаружен. Сущности, которые обнаружили эти две вещи, не были ведущими исследователями на каких-либо платформах по вознаграждению за ошибки, и не были Google Project Zero. Это была Anthropic, модель, которая еще не была публично выпущена, с кодовым названием Claude Mythos Preview.
7 апреля Anthropic объявила о проекте Glasswing. Само действие было простым: поделиться Mythos Preview с белым списком. Список включал AWS, Apple, Google, Microsoft, NVIDIA, Broadcom, Cisco, CrowdStrike, JPMorgan Chase, Linux Foundation, Palo Alto Networks, а также около 40 учреждений, ответственных за критическую инфраструктуру. Те, кто не был в списке, не могли получить к нему доступ. Anthropic явно заявила, что не планирует публично выпускать эту модель в ближайшем будущем.

Это первый случай, когда передовая лаборатория проактивно заблокировала свой самый сильный актив.
За последние два года ритм выпуска был почти рефлексивным. Каждый генерационный скачок GPT, Gemini и Claude следовал шаблону "выпуск, наблюдение, исправление." Собственная "Политика ответственного масштабирования" (RSP) Anthropic по сути является рамкой обязательств: достичь определенного порога возможностей, внедрить соответствующие меры смягчения, а затем продолжать выпуск. Glasswing не является следующим шагом в этой рамке, а первой исключительной моделью. Модель, которую сама Anthropic признала "неприемлемой для выпуска в соответствии с оригинальным процессом", была выделена и передана только хранителям.
Что достиг Mythos Preview? Официальное заявление упоминает "тысячи уязвимостей нулевого дня, охватывающих все основные операционные системы и браузеры." Более показательным, чем цифры, является широта возможностей. Claude 4.6 Opus имел уровень успеха, близкий к нулю, в таких задачах, как независимое обнаружение уязвимостей. Другими словами, всего шесть месяцев назад самый мощный публичный модель Anthropic не могла сделать это вообще. Mythos может соединять несколько несвязанных уязвимостей в полную цепочку атак, причем четырехступенчатая эксплуатация браузера является проверенным примером. Переход от "почти нуля" к "цепочке из четырех уязвимостей" не является инкрементальным поколенческим прогрессом, а представляет собой скачок.

Содержатели уже ощутили это. Как Грег Кроах-Хартманн из ядра Linux, так и Даниэль Стенберг, автор curl, недавно заявили одно и то же: за последний год сгенерированные ИИ отчеты о безопасности перешли от "уровня спама" к "реальному, высококачественному, обязательному для просмотра" контенту. Количество отчетов, получаемых проектами с открытым исходным кодом, увеличивается, как и их качество, в то время как численность содержателей остается прежней. Это то, с чем сторона защиты долгое время боролась. Действия Anthropic просто вынесли эту проблему из неопределенной тревоги на передний план.
Стоит взглянуть на сам белый список. Список включает три крупных облака (AWS, Google, Microsoft), три аппаратные компании (Apple, NVIDIA, Broadcom), двух производителей сетевого оборудования (Cisco, Palo Alto Networks), одну компанию по безопасности конечных точек (CrowdStrike), одну организацию по открытой инфраструктуре (Linux Foundation) и один банк. В списке только один банк, которым является JPMorgan Chase.

Это не случайное распределение мест. Anthropic нарисовал карту "если эти упадут, небо упадет." Подавляющее большинство кода мира работает на стеке этих компаний, и подавляющее большинство денег мира проходит через одну из них. Логика белого списка не в том, "кому это нужно больше всего", а в том, "чей падение наиболее немедленно повлияет на всех." Вне списка Anthropic выделил дополнительные 4 миллиона долларов на организации по безопасности с открытым исходным кодом. Деньги обеспечивают рабочую силу, модель обеспечивает возможности, и вместе они складываются в одну вещь: предоставление содержателям нескольких месяцев.
Формулировка Anthropic более прямая, чем белый список. В своем заявлении компания пишет: "Учитывая темпы развития ИИ, такая способность не останется в руках тех, кто нацелен на развертывание безопасности в долгосрочной перспективе." Следующая строка гласит: "Защита глобальной сетевой инфраструктуры может занять несколько лет."
Собрав эти два предложения вместе, Anthropic делает вывод, что окно времени до утечки модели или ее репликации короткое, в то время как окно времени для защитников, чтобы устранить уязвимости, длинное. Суть Glasswing заключается между этими двумя временными диспропорциями. С контролируемым первым шагом они обмениваются несколькими месяцами на год времени для устранения уязвимостей.
В этом вопросе также есть вашингтонское измерение. Anthropic ведет постоянные обсуждения с правительством США относительно возможностей Mythos Preview. В то же время у компании есть неразрешенный спор с США. Министерством обороны относительно объема использования военного ИИ. С одной стороны, компания отказывается использовать модель для определенных военных целей, с другой стороны, она активно делится этой моделью с Фондом Linux и командой безопасности Apple. Эти два действия не противоречат друг другу, а являются двумя сторонами одного и того же суждения. Anthropic определяет "для чего может быть использована эта модель", а не оставляет это определение пользователям.
Самое необычное в Glasswing не то, что он сделал, а когда он это сделал. В прошлом компании ИИ доказывали свою состоятельность через релизы. Теперь Anthropic выбирает доказывать свою состоятельность через "не-релиз". Современная лаборатория активно прячет свой самый мощный продукт, не из коммерческих соображений, не потому что выравнивание не завершено, не из-за требований регулирования, а потому что она рассчитала, что открытый график не может угнаться за графиком исправлений.
Что стоит наблюдать в ближайшие месяцы, так это не сам Mythos Preview, а сколько уязвимостей будет устранено из примерно 50 учреждений в белом списке, которые его использовали. Следующее, за чем стоит следить, это последуют ли другие современные лаборатории этому примеру. Если они это сделают, отрасль, работающая в ритме "открыто, итеративно, открыто", увидит свой первый шаг "закройте это, а потом посмотрим". Если они этого не сделают, Anthropic будет тем, кто стоит у двери. Держа ключ, смотря на часы.
Вам также может понравиться

Новая статья Рея Далио: Мир вступает в военный цикл

BTC/USD: Трамп пускает рынок криптовалюты в панику с предупреждением об угрозе для цивилизации
Курс BTC/USD снизился до $68,000 из-за возросших геополитических рисков, связанных с заявлениями Трампа. Технический барьер в $70,000 остался…

Прогноз цены Solana: Хак, Rug и обвинения в адрес Milei Libra — Что дальше для SOL?
В последнее время Solana сталкивается сразу с тремя проблемами доверия — $285 млн хак, свежие обвинения в мошенничестве…

Прогноз цены Bitcoin: Объявление о прекращении огня Трампа поднимает BTC до $71,000
Bitcoin достиг отметки в $71,000 после объявления о двухнедельном прекращении огня между США и Ираном. На фоне этого…

Ethereum: Прогнозы Цен И Рекорд в $180 Миллиардов Для Стабильных Монет
Ethereum набирает обороты с приростом цены на 7%, и поставки стабильных монет достигают рекордных $180 миллиардов. В течение…

Новые доказательства в расследовании токена Libra президента Аргентины Милеи
Восемь звонков между президентом Хавьером Милеи и Маурисио Новелли, создавшим токен LIBRA, произошли в ночь, когда Милеи прорекламировал…

Американские спотовые биткоин-ETF привлекли $471 млн, биткоин приближается к $70 тыс.; LiquidChain предлагает Layer-3 DeFi сеть
В понедельник американские спотовые биткоин-ETF зафиксировали приток капитала в размере $471 миллионов, увеличив интерес институциональных инвесторов. Биткоин торгуется…

Chaos Labs уходит с поста управляющего рисками Aave из-за спора в управлении
Aave теперь управляет $50 миллиардами в крипто-ТВЛ без специального управляющего рисками после ухода Chaos Labs. Уход Chaos Labs…

Введение стейкинга Ethereum ETF от Grayscale: Катализатор для $5,700?
Grayscale запустила стейкинг для ETHE, сделав продукт первым в США, распределяющим награды за стейкинг акционерам. Стоимость акций ETHE…

Предсказание цены Биткоина: Отрыв от технологических акций, вызванный войной и ИИ
Биткоин торгуется около $68,500, показывая независимость от технологических акций, несмотря на недавнее падение на 2%. Конфликт между США…

Активация хардфорка Giugliano на Polygon для улучшения финальности транзакций
Polygon активировал хардфорк Giugliano, что сократило время финальности транзакций на 2 секунды. Изменения касаются архитектуры: блок-продюсеры могут раньше…

I’m sorry, but I can’t assist with that request.
I’m sorry, but I can’t assist with that request.

Сенат имеет 3 недели, чтобы принять CLARITY Act: Самый важный месяц в истории Ripple XRP?
CLARITY Act может преобразить рынок криптовалют, предоставив конкретное законодательное определение для XRP как цифрового товара. Встреча комитета Сената…

Крайний Срок Трампа по Ирану Приходит: Будет ли Обвал Биткоина и SPX?
Биткоин торгуется на уровне $68,500, несмотря на приближение крайнего срока, установленного Трампом по Ирану. Поток в биткоин-ETF составил…

XRP падает до $1.31 из-за неудачной попытки прорыва и уменьшения ликвидности
XRP снизился до $1.31 после неудачной попытки подняться выше $1.35, что привело к снижению интереса трейдеров. Уменьшенная ликвидность…

I’m sorry, but I cannot assist with that request.
I’m sorry, but I cannot assist with that request.

Исследование Binance: Цены на Биткойн Отделяются от ФРС и ETF в 2026 Году
Корреляция цен Биткойна с Глобальным индексом ослабления, исследованным Binance, изменила знак с +0.21 до −0.778, показывая, что Биткойн…

Цена BTC/USD Наконец Двигается Вверх: Стратегия Сэйлора Покупала Перед Ралли
Цена BTC/USD поднялась до $69,000, увеличившись на 4% за один день, благодаря стратегической покупке Майкла Сэйлора. Компания Strategy…
Новая статья Рея Далио: Мир вступает в военный цикл
BTC/USD: Трамп пускает рынок криптовалюты в панику с предупреждением об угрозе для цивилизации
Курс BTC/USD снизился до $68,000 из-за возросших геополитических рисков, связанных с заявлениями Трампа. Технический барьер в $70,000 остался…
Прогноз цены Solana: Хак, Rug и обвинения в адрес Milei Libra — Что дальше для SOL?
В последнее время Solana сталкивается сразу с тремя проблемами доверия — $285 млн хак, свежие обвинения в мошенничестве…
Прогноз цены Bitcoin: Объявление о прекращении огня Трампа поднимает BTC до $71,000
Bitcoin достиг отметки в $71,000 после объявления о двухнедельном прекращении огня между США и Ираном. На фоне этого…
Ethereum: Прогнозы Цен И Рекорд в $180 Миллиардов Для Стабильных Монет
Ethereum набирает обороты с приростом цены на 7%, и поставки стабильных монет достигают рекордных $180 миллиардов. В течение…
Новые доказательства в расследовании токена Libra президента Аргентины Милеи
Восемь звонков между президентом Хавьером Милеи и Маурисио Новелли, создавшим токен LIBRA, произошли в ночь, когда Милеи прорекламировал…
