Quão perigoso é o Mythos? Por que a Anthropic decidiu não lançar o novo modelo

By: blockbeats|2026/04/16 13:24:34

Título original do artigo: Como a Anthropic percebeu que o Mythos era perigoso demais para ser lançado ao público
Autores do artigo original: Margi Murphy, Jake Bleiberg e Patrick Howell O'Neill, Bloomberg
Tradução: Peggy, BlockBeats

Nota do editor: Quando uma empresa de IA opta por não disponibilizar seu modelo mais poderoso diretamente ao público, isso, por si só, já indica um problema.

O Mythos, da Anthropic, já era capaz de executar de forma autônoma todo o processo de um ataque. Desde a descoberta de vulnerabilidades de dia zero e a criação de códigos de exploração até a combinação de sequências de várias etapas para invadir sistemas centrais, essas tarefas — que antes exigiam a colaboração de hackers de ponta durante um longo período — foram reduzidas a poucas horas ou até mesmo minutos.

É por isso que, no momento em que o modelo foi divulgado, Scott Bessent e Jerome Powell convocaram uma reunião com instituições de Wall Street, solicitando que o utilizassem para uma “autoavaliação”. Quando a capacidade de detecção de vulnerabilidades é aplicada em grande escala, o sistema financeiro deixa de enfrentar ataques isolados e passa a sofrer varreduras contínuas.

Uma mudança mais profunda reside na estrutura da oferta. No passado, a detecção de vulnerabilidades dependia de algumas equipes de segurança e da expertise de hackers, em um processo lento e não replicável. Atualmente, essa capacidade está começando a ser incorporada em massa nos modelos, reduzindo o limiar tanto para os ataques quanto para as defesas. Uma metáfora de alguém que está por dentro do assunto é bastante direta: entregar o modelo a um hacker comum é como dotá-lo de capacidades de operações especiais.

As instituições começaram a utilizar as mesmas ferramentas para verificar retrospectivamente os seus próprios sistemas. O JPMorgan Chase, a Cisco Systems e outras empresas estão realizando testes internos, na esperança de corrigir as vulnerabilidades antes que elas sejam exploradas. No entanto, as limitações da realidade não mudaram; a velocidade das descobertas está aumentando, enquanto o processo de correção continua lento. "Somos bons em identificar vulnerabilidades, mas não em corrigi-las", como destacou Jim Zemlin, ressaltando o descompasso temporal.

Na verdade, como o Mythos não é apenas uma melhoria em uma única funcionalidade, mas sim uma integração, aceleração e redução do limiar de usabilidade de capacidades de ataque antes dispersas e limitadas, uma vez fora do ambiente controlado, ainda não se sabe como essa capacidade se espalhará, não havendo experiências anteriores para servir de referência.

O perigo não está no que ela pode fazer, mas em quem pode usá-la e em que condições.

O artigo original é o seguinte:

Numa noite amena de fevereiro, durante um intervalo em um casamento em Bali, Nicholas Carlini afastou-se por um instante, abriu seu laptop e preparou-se para “causar um pouco de confusão”. Naquele momento, a Anthropic acabara de lançar um novo modelo de inteligência artificial chamado Mythos para testes internos, e esse renomado pesquisador de IA estava prestes a ver o quanto ele realmente poderia causar problemas.

A Anthropic contratou Carlini para realizar testes de estresse em seus modelos de IA, a fim de avaliar se hackers poderiam explorá-los para fins de espionagem, roubo ou destruição. Ao participar de um casamento indiano em Bali, Carlini ficou impressionada com as capacidades desse modelo.

Em apenas algumas horas, ele descobriu várias técnicas que poderiam ser usadas para invadir sistemas utilizados em todo o mundo. Ao retornar ao escritório da Anthropic no centro de São Francisco, ele descobriu ainda que o Mythos já era capaz de gerar autonomamente poderosas ferramentas de invasão, incluindo táticas direcionadas ao Linux — a espinha dorsal da maioria dos sistemas de computação modernos.

O Mythos encenou um “assalto digital a um banco”: conseguiu contornar os protocolos de segurança, entrar no sistema de rede pela porta da frente e, em seguida, invadir o cofre digital para obter seus ativos online. No passado, a IA só conseguia “arrombar fechaduras”, mas agora tem a capacidade de planejar e executar um “assalto” completo.

Carlini e alguns colegas começaram a dar o alarme dentro da empresa, relatando suas descobertas. Enquanto isso, quase todos os dias, eles descobriam vulnerabilidades de alto risco, que podiam chegar a ser fatais, nos sistemas que o Mythos examinava — problemas que, normalmente, apenas os melhores hackers do mundo seriam capazes de detectar.

Quão perigoso é o Mythos? Por que a Anthropic decidiu não lançar o novo modelo

Ficou comprovado que o modelo de IA de última geração da Anthropic, o Mythos, tem a capacidade de invadir diversos sistemas globais. (Fonte da imagem: (Jakub Porzycki / NurPhoto / AP)

Ao mesmo tempo, internamente na Anthropic, uma equipe chamada “Frontier Red Team” — composta por 15 funcionários conhecidos como “Ants” — também estava realizando testes semelhantes. A responsabilidade dessa equipe era garantir que os modelos da empresa não fossem utilizados para prejudicar a humanidade. Eles levavam cães robóticos para dentro de armazéns e realizavam testes com engenheiros para verificar se os chatbots poderiam ser usados para controlar esses dispositivos de forma maliciosa; também colaboravam com biólogos para avaliar se os modelos poderiam ser utilizados na criação de armas biológicas.

No entanto, desta vez, eles foram percebendo aos poucos que o maior risco representado pela Mythos vinha da área de segurança cibernética. "Logo nas primeiras horas em que tivemos o modelo, percebemos que era diferente", disse Logan Graham, responsável pela equipe.

O modelo anterior, o Opus 4.6, havia demonstrado a capacidade de auxiliar os seres humanos a explorar vulnerabilidades de software. Mas Graham destacou que o Mythos agora poderia “colocar a mão na massa” e explorar essas vulnerabilidades por conta própria. Isso representava um risco para a segurança nacional e, com base nisso, ele emitiu uma advertência à direção da empresa. Isso o obrigou a enfrentar um dilema: explicar à diretoria que o próximo grande motor de receita da empresa talvez não pudesse ser lançado ao público por ser muito perigoso.

Jared Kaplan, cofundador e cientista-chefe da Anthropic, afirmou que, durante o processo de treinamento do Mythos, ele acompanhou "muito de perto" o progresso do sistema. Em janeiro, ele começou a perceber que a capacidade do modelo de detectar vulnerabilidades no sistema era excepcionalmente forte. Como físico teórico, Kaplan precisava determinar se essas capacidades eram apenas um “fenômeno tecnicamente interessante” ou “uma realidade intimamente ligada à infraestrutura da internet”. No fim das contas, ele concluiu que era a segunda opção.

Jared Kaplan (cofundador e cientista-chefe da Anthropic) Fonte da imagem: Chris J. Ratcliffe/Bloomberg

Durante um período de duas semanas, entre o final de fevereiro e o início de março, Kaplan e o cofundador Sam McCandlish estavam decidindo se lançariam esse modelo.

Na primeira semana de março, a equipe de direção da empresa — incluindo o CEO Dario Amodei, a presidente Daniela Amodei, o diretor de segurança da informação Vitaly Gudanets e outros — realizou uma reunião para ouvir a apresentação de Kaplan e McCandlish.

A conclusão deles foi que o Mythos apresentava um risco muito alto e não era adequado para um lançamento público completo. No entanto, a Anthropic ainda deveria permitir que algumas empresas, incluindo concorrentes, testassem o produto.

<p"Rapidamente percebemos que, desta vez, era preciso adotar uma abordagem consideravelmente diferente; não seria um lançamento de produto rotineiro", disse Kaplan>

Na primeira semana de março, a empresa finalmente chegou a um consenso: aprovar o Mythos para implantação como ferramenta de defesa em cibersegurança.

Dario Amodei (CEO da Anthropic) Fonte da imagem: Samyukta Lakshmi/Bloomberg

A reação do mercado foi quase instantânea. No dia em que a Anthropic revelou a existência do Mythos, nos EUA O secretário do Tesouro, Scott Bessent, e o presidente do Federal Reserve, Jerome Powell, convocaram uma reunião de emergência com as principais instituições de Wall Street em Washington, D.C. A mensagem foi bem clara: utilize imediatamente o Mythos para identificar vulnerabilidades em seus sistemas.

De acordo com uma fonte próxima aos executivos presentes na reunião (que pediu para permanecer anônima devido ao caráter confidencial das discussões), a seriedade da reunião era evidente — os participantes chegaram a se recusar a revelar o conteúdo da reunião até mesmo a alguns assessores principais.

Autoridades da Casa Branca emitiram um alerta urgente sobre o Mythos como uma potencial ferramenta de hacking e recomendaram que "seja usado para fins de defesa", apontando para uma mudança mais profunda: a inteligência artificial está se tornando rapidamente uma força decisiva no campo da segurança cibernética. A Anthropic disponibilizou o Mythos de forma seletiva para uso limitado por algumas instituições no âmbito da iniciativa “Project Glasswing”, incluindo empresas como a Amazon Web Services, a Apple e o JPMorgan Chase, permitindo que elas realizassem testes; ao mesmo tempo, órgãos governamentais também demonstraram grande interesse.

Antes de disponibilizar a versão ao público, a Anthropic informou detalhadamente altos funcionários do governo dos Estados Unidos sobre as capacidades da versão prévia do Mythos, incluindo suas possíveis aplicações tanto em ataques cibernéticos quanto na defesa. Ao mesmo tempo, a empresa mantém discussões contínuas com vários governos nacionais. Um funcionário da Anthropic, que pediu para permanecer anônimo devido a questões internas, revelou essa informação.

A concorrente OpenAI não demorou a seguir o exemplo, anunciando na terça-feira o lançamento de uma ferramenta para detectar vulnerabilidades de software: o GPT-5.4-Cyber.

Ao testar as primeiras versões, os pesquisadores descobriram dezenas de casos de comportamento “preocupantes”, incluindo o desrespeito às instruções humanas e, em casos muito raros, a tentativa de ocultar suas ações após violarem as instruções.

Atualmente, a Anthropic ainda não lançou oficialmente o Mythos ao público como uma ferramenta de segurança cibernética, e pesquisadores externos ainda não validaram totalmente suas capacidades. No entanto, a decisão anterior da empresa de "acesso restrito" reflete um consenso crescente entre o setor e o governo: A IA está remodelando a estrutura econômica da segurança cibernética — ela reduz significativamente o custo da detecção de vulnerabilidades, diminui o tempo de preparação dos ataques e reduz as barreiras técnicas para certos tipos de ataques.

A Anthropic também alertou que a maior autonomia do Mythos representa riscos por si só. Durante os testes, a equipe observou vários casos preocupantes: o modelo desobedeceu às instruções e chegou até a tentar apagar os rastros após uma violação. Em um incidente, o modelo elaborou de forma autônoma um plano de ataque em várias etapas para “escapar” de um ambiente restrito, obter acesso mais amplo à internet e divulgar conteúdo de forma proativa.

No mundo real, os softwares utilizados por aplicativos que vão desde sistemas bancários até sistemas hospitalares geralmente contêm vulnerabilidades de código complexas e difíceis de detectar, que muitas vezes levam semanas ou até meses para serem identificadas por profissionais. Quando os hackers exploram essas vulnerabilidades, isso pode levar a vazamentos de dados ou ataques de ransomware, resultando em consequências graves.

No entanto, muitos pesos pesados também têm questionado as verdadeiras capacidades do Mythos e seus riscos potenciais. David Sacks, consultor de IA da Casa Branca, declarou na plataforma social X: "Cada vez mais pessoas estão começando a questionar se a Anthropic é o 'menino que gritou 'lobo' no setor de IA. Se a ameaça representada pela Mythos não se concretizar no final, a empresa enfrentará um grave problema de reputação.

No entanto, a realidade é que os hackers já vêm utilizando há muito tempo modelos de linguagem de grande porte para lançar ataques sofisticados. Por exemplo, um grupo de espionagem cibernética já utilizou o modelo Claude, da Anthropic, para tentar invadir cerca de 30 alvos; outros invasores têm usado IA para roubar dados de órgãos governamentais, instalar ransomware e até mesmo contornar rapidamente centenas de ferramentas de firewall utilizadas para proteção de dados.

De acordo com uma fonte a par do assunto, as autoridades de segurança nacional dos EUA consideram que o surgimento do Mythos traz uma incerteza sem precedentes — a avaliação dos riscos de segurança cibernética tornou-se ainda mais desafiadora. Se esse modelo fosse disponibilizado a hackers individuais, seu efeito poderia ser semelhante ao de transformar um soldado comum em um agente das forças especiais.

Ao mesmo tempo, esse tipo de modelo também poderia se tornar um “amplificador de capacidades”, permitindo que uma organização criminosa de hackers possuísse a capacidade de ataque de um pequeno Estado-nação e possibilitando que hackers de inteligência e militares de alguns países de pequeno a médio porte realizassem ataques cibernéticos que antes só as grandes potências podiam levar a cabo.

O ex-chefe de segurança cibernética da NSA, Rob Joyce, afirmou: "Acredito que, a longo prazo, a IA nos tornará mais seguros e resilientes. No entanto, entre agora e algum momento no futuro, haverá um “período sombrio” durante o qual a IA ofensiva terá uma vantagem clara — aqueles que não tiverem reforçado adequadamente suas defesas serão os primeiros a sucumbir.

Vale ressaltar que o Mythos não é o único modelo com essas capacidades. Várias organizações já vêm utilizando grandes modelos de linguagem para a pesquisa de vulnerabilidades, incluindo versões iniciais do Claude e do Big Sleep.

Antes do lançamento do Mythos, o JPMorgan Chase já havia obtido sucesso na utilização de grandes modelos de linguagem para ajudar a identificar vulnerabilidades em softwares bancários. Uma pessoa a par da situação (que pediu para permanecer anônima devido ao seu envolvimento em projetos de segurança interna) revelou essa informação. (Fonte da imagem: (Michael Nagle / Bloomberg)

De acordo com a fonte, as “vulnerabilidades de dia zero”, cuja identificação e criação de código de exploração antes levavam dias ou até semanas, agora podem ser identificadas em apenas uma hora, ou até mesmo em minutos, com o uso da IA. Uma "vulnerabilidade de dia zero" refere-se a uma falha de segurança que os defensores ainda não detectaram, o que deixa quase nenhum tempo para a aplicação de correções.

Atualmente, o foco do JPMorgan Chase está principalmente na cadeia de suprimentos e no setor de software de código aberto, onde a empresa identificou várias vulnerabilidades e enviou relatórios aos respectivos fornecedores.

O CEO da empresa, Jamie Dimon, afirmou durante uma teleconferência sobre os resultados financeiros que o surgimento do Mythos “indica que ainda há um grande número de vulnerabilidades que precisam ser resolvidas com urgência”.

Fonte da imagem de Jamie Dimon: Krisztian Bocsi / Bloomberg

De acordo com uma fonte a par do assunto, o JPMorgan Chase já havia entrado em contato com a Anthropic para discutir a realização de testes com o modelo antes que a existência do Mythos se tornasse de conhecimento público. A fonte, que pediu para permanecer anônima por não estar autorizada a se pronunciar publicamente, afirmou que o JPMorgan Chase se recusou a comentar o assunto.

Atualmente, outros bancos de Wall Street e empresas de tecnologia também estão tentando usar o Mythos para corrigir proativamente falhas no sistema antes que os hackers descubram as vulnerabilidades. A Bloomberg informou que instituições financeiras como Goldman Sachs, Citigroup, Bank of America e Morgan Stanley já testaram essa tecnologia internamente.

Os funcionários da Cisco Systems estão particularmente atentos a uma questão: se os invasores utilizarão a IA para encontrar formas de violar o software dos dispositivos de rede implantados globalmente — esses dispositivos incluem roteadores, firewalls e modems. Anthony Grieco, diretor de segurança e confiança da empresa, manifestou preocupações específicas de que a IA possa acelerar os ataques de hackers a dispositivos em “fim de vida útil” que não receberão mais atualizações de suporte da Cisco.

No entanto, corrigir as vulnerabilidades detectadas pela IA continuará sendo um desafio constante. Esse processo, conhecido como “aplicação de patches de segurança”, costuma ser dispendioso e demorado para as organizações, o que leva muitas delas a ignorar as vulnerabilidades. Ataques catastróficos como o sofrido pela Equifax — em que foram roubados os dados de aproximadamente 147 milhões de pessoas — ocorreram porque vulnerabilidades conhecidas não foram corrigidas prontamente.

No incidente de violação de dados da Equifax, os invasores roubaram registros pessoais de aproximadamente 147 milhões de pessoas. (Fonte da imagem: (Elijah Nouvelage / Bloomberg)

Apesar de ter sido identificada pelo governo Trump como uma “ameaça à cadeia de suprimentos” após se recusar a colaborar na realização de vigilância em larga escala sobre cidadãos americanos, a Anthropic está atualmente envolvida em discussões e colaborações com agências federais.

Os EUA O Departamento do Tesouro está solicitando aprovação para utilizar o Mythos esta semana. O secretário do Tesouro, Scott Bessent, afirmou que esse modelo ajudará os Estados Unidos a manter sua vantagem competitiva no campo da inteligência artificial.

Scott Bessent Fonte da imagem: Matt McClain / Bloomberg

Em um teste, o Mythos escreveu um código de ataque para navegadores que combinou quatro vulnerabilidades diferentes em uma cadeia de exploração completa — uma tarefa extremamente desafiadora, mesmo para hackers humanos. Um relatório de pesquisa sobre segurança cibernética observou que essa “cadeia de vulnerabilidades” frequentemente rompe limites de sistemas originalmente seguros, de forma semelhante à abordagem utilizada no ataque do Stuxnet às centrífugas das instalações nucleares do Irã há alguns anos.

Além disso, segundo a Anthropic, quando recebe instruções explícitas, o Mythos é capaz até mesmo de identificar e explorar “vulnerabilidades de dia zero” em todos os principais navegadores.

A Anthropic afirmou que utilizou o Mythos para identificar vulnerabilidades no código do Linux. Jim Zemlin destacou que o Linux “equipa a maioria dos sistemas de computação atualmente”, desde smartphones Android e roteadores de internet até os supercomputadores da NASA, e é praticamente onipresente. O Mythos é capaz de detectar autonomamente falhas em várias bases de código-fonte aberto e, uma vez exploradas essas vulnerabilidades, os invasores podem potencialmente assumir o controle total de toda a máquina.

Atualmente, dezenas de funcionários da Linux Foundation começaram a testar o Mythos. Zemlin acredita que uma questão fundamental é se o modelo da Anthropic pode fornecer insights valiosos para ajudar os desenvolvedores a criar softwares mais seguros desde o início, reduzindo assim a criação de vulnerabilidades.

"Somos muito bons em encontrar vulnerabilidades", disse ele, "mas não somos muito bons em corrigi-las."

[Link para o artigo original]

Preço de --