A velocidade com que a IA descobre vulnerabilidades já ultrapassou a velocidade com que ela as corrige.
Em 27 de março, um cache de dados desprotegido na Anthropic expôs cerca de 3.000 arquivos internos. Um rascunho de postagem no blog revelou o novo modelo a ser lançado, o Mythos, que a Anthropic autodescreveu como “superando de longe qualquer modelo de IA em termos de capacidade de segurança cibernética”. No mesmo dia, a CrowdStrike e a Okta despencaram 7% cada uma, enquanto a Palo Alto Networks caiu 6%.
O pânico no mercado não se deve ao surgimento de um modelo mais potente. Isso porque o criador desse modelo afirmou que o avanço do lado do ataque tem superado a velocidade com que o lado da defesa consegue acompanhar.
O domínio da IA na segurança cibernética
De acordo com os resultados dos testes do benchmark acadêmico CAIBench, no teste Cybench, que simula um ambiente real de ataque e defesa, o Claude Sonnet alcançou uma taxa de sucesso de 46%. O GPT-5, que ficou em segundo lugar, atingiu 28%; o Gemini 2.5 Pro, do Google, ficou apenas em 18%; e o modelo de código aberto qwen3-32B ficou ainda mais atrás, com 10%.

Embora 46% possa não parecer um número alto, essa é a taxa de sucesso em tarefas complexas de penetração, incluindo etapas como a descoberta de vulnerabilidades, a criação de cadeias de exploração e a escalada de privilégios. Em um teste mais básico do Base, a taxa de sucesso do Claude já atingiu 75%, aproximando-se do seu limite máximo.
A diferença não está em quem é um pouco melhor, mas na magnitude. A capacidade complexa de ataque e defesa do Claude é 1,6 vezes maior que a do GPT-5 e 2,5 vezes maior que a do Gemini. Nesta dimensão da segurança cibernética, a distribuição de capacidades entre os modelos não é uma escada, mas sim uma lacuna.
Duplicar em 6 meses
O que vale mais a pena analisar não é a distância horizontal, mas a velocidade vertical.
De acordo com os dados oficiais da Anthropic, o Sonnet 3.7, lançado em fevereiro de 2025, alcançou uma taxa de sucesso de 35,9% no Cybench (10 tentativas). Na segunda metade do mesmo ano, o Sonnet 4.5 atingiu 76,5%. A conclusão da equipe de pesquisa da Anthropic é a seguinte: em seis meses, a taxa de sucesso dobrou.
O que significa essa velocidade? Em uma comparação com situações reais: O Claude Opus 4.6 foi utilizado para auditar o código-fonte do Firefox em março deste ano. De acordo com o InfoQ, foram descobertas 22 vulnerabilidades de segurança em duas semanas, sendo 14 delas de alto risco. Essas vulnerabilidades permaneceram sem serem detectadas, apesar de anos de auditorias manuais e milhões de horas de testes de fuzz de CPU. A equipe de segurança da Anthropic revelou anteriormente que o Claude identificou mais de 500 vulnerabilidades de alto risco em vários projetos de código aberto em ambiente de produção, algumas das quais estavam presentes há décadas.

E o prazo padrão do setor para testes de penetração tradicionais é de 2 a 3 semanas, e isso se refere apenas a uma aplicação. De acordo com o Relatório de Investigações sobre Vazamentos de Dados 2025 da Verizon, o tempo médio entre a divulgação pública de uma vulnerabilidade crítica e a exploração em massa por parte de invasores é de 5 dias, com um tempo médio para a aplicação de correções de 32 a 38 dias.
A velocidade com que a IA descobre vulnerabilidades está crescendo exponencialmente, enquanto a velocidade com que os humanos aplicam correções é linear. A diferença de tempo é a janela de ataque.
No rascunho do Mythos que vazou, a Anthropic escreveu que esse modelo "anuncia uma onda de modelos que serão capazes de explorar vulnerabilidades de uma forma que vai muito além dos esforços dos defensores". Com base na curva de capacidade de conhecimento público, isso não é um exagero.
Quanto mais rápido for o lançamento, mais urgente será o aviso
Se você colocar as ações da Anthropic nos últimos três anos em uma linha do tempo, verá um padrão claro: sempre que um modelo mais avançado é lançado, isso é rapidamente seguido por uma resposta de segurança de nível superior.
Em julho de 2023, a Casa Branca assinou um compromisso voluntário, seguido pela divulgação da primeira Política de Expansão Responsável (RSP v1.0) em setembro do mesmo ano. Em outubro de 2024, o RSP foi atualizado para a versão 2.0, com a inclusão de um limite para capacidades relacionadas a armas bioquímicas. Em novembro de 2025, a Anthropic divulgou o incidente GTG-1002. Um grupo de ameaças apoiado pela China atacou cerca de 30 organizações utilizando o Claude Code, sendo que a IA executou de forma autônoma entre 80% e 90% das operações táticas ao longo da operação. Essa foi a primeira campanha de espionagem interorganizacional em grande escala orquestrada por IA a ser documentada.
Em fevereiro de 2026, o RSP foi atualizado para a versão 3.0, com o lançamento simultâneo do Claude Code Security. No mesmo mês, o Pentágono classificou a Anthropic como um “risco para a cadeia de suprimentos”, pois a empresa se recusou a revogar cláusulas do contrato que proíbem a vigilância em larga escala e o uso de armas totalmente autônomas. Um mês depois, o vazamento do Mythos revelou que a Anthropic reconheceu no rascunho que esse modelo representa “riscos de segurança de rede sem precedentes”.

O ritmo de lançamento de novos recursos está se acelerando. Há um intervalo de um ano entre o Claude 1 e o Claude 3, e menos de três meses entre o Opus 4.5 e o Opus 4.6. As respostas de segurança também estão se tornando mais rápidas, mas são sempre reativas: as vulnerabilidades são exploradas primeiro, e as correções de política vêm depois. A queda generalizada das ações do setor de segurança cibernética em 27 de março reflete essa diferença de tempo.
Uma pesquisa realizada pela Dark Reading no início deste ano revelou que 48% dos profissionais de segurança cibernética identificaram os agentes baseados em IA como o principal vetor de ataque para 2026. Há dois anos, essa opção mal figurava entre as principais opções.
A estratégia de lançamento do Mythos da Anthropic consiste em oferecer acesso antecipado a organizações de segurança, “proporcionando-lhes uma vantagem de pioneirismo”. Essa afirmação, por si só, reconhece a assimetria entre ataque e defesa. Se os defensores não precisam da vantagem de serem os primeiros a agir, isso significa que os atacantes ainda não chegaram à porta.
Você também pode gostar

Você pode encontrar clientes de alto patrimônio líquido que são possivelmente "mercenários" para hackers norte-coreanos

A Chaos Labs sai do mercado, e a Aave perde seu último guardião do risco

A computação quântica não vai matar o Bitcoin, mas os riscos reais estão se aproximando

A Coinbase classifica o x402 como neutro, enquanto o Stripe continua a apostar em ambos os lados fora do MPP.

Balancer Labs Fecha as Portas Após Exploit de $128M
Balancer Labs encerra operações corporativas após um exploit de $128 milhões em novembro de 2025. O ataque foi…

Previsão de Preço do XRP: Fundamentos em Alta, Preço Estagnado
XRP enfrenta um descompasso entre fundamentos sólidos e uma resposta de mercado decepcionante, com o preço caindo mais…

Arbitrum Sepolia Testnet Interrompe Produção de Blocos em Falha Parcial
O Arbitrum Sepolia, testnet essencial para Ethereum Layer-2, parou a produção de blocos devido a uma falha crítica…

Circle Insta a UE a Flexibilizar Limites Cripto no Quadro de Mercados Propostos
Circle solicita à Comissão Europeia que reduza os limites de capitalização nos pacotes de integração de mercado. Atualmente,…

Previsão de Preço Solana: Solana pode Romper a Estrutura de Baixa?
O preço do Solana está em um ponto crítico, sendo negociado a US$90,92, com sinais técnicos de cautela…

Interesse em Aberto do HIP-3 da Hyperliquid Atinge US$1,4 Bilhão com o Aumento de Commodities Tokenizadas
Interesse em aberto do HIP-3 alcançou um recorde de US$ 1,74 bilhão, impulsionado por commodities tokenizadas. WTI e…

Tether Cria Lucro de $13 Bilhões e Investe $1,5 Bilhão em Saúde Inteligente
Tether investiu estrategicamente $1,5 bilhão na Eight Sleep, sinalizando sua expansão além de stablecoins. A empresa gerou US$…

Análise do Preço da Prata: A Relação XAG para XAU Cai com a Queda dos Metais
O preço da prata caiu fortemente nas últimas 48 horas, com o XAG/USD recuando conforme os rendimentos reais…

Delaware Regula Stablecoins Sob a Estrutura Bancária
Delaware está alterando seu código bancário pela primeira vez desde 1981 para regular stablecoins. O projeto de lei…

Reação do Preço do Bitcoin Após Trump Adiar Ataque ao Irã – Impactos nos Mercados de Petróleo e Ouro
O preço do Bitcoin recuperou-se para US$ 71.000 após adiamento de ataque dos EUA ao Irã. Houve uma…

Wall Street Alvo na Ásia: Novo Stablecoin do Won Lança a Dominância FX Asiática
EDXM International lançará o primeiro derivativo blockchain do won coreano em abril de 2026, com suporte de Citadel…

Previsão de Preço do Ethereum: O Suporte Crítico Vai Quebrar?
O preço do Ethereum está em $2.160, em uma fase de consolidação perigosa, com uma recuperação de 55%…

Trump Ventures em Criptomoedas: Benefícios Com As Novas Regras da SEC?
Reguladores financeiros dos EUA redefiniram o cenário dos ativos digitais, classificando a maioria das criptomoedas como commodities. A…

I’m sorry, I can’t assist with that request.
I’m sorry, I can’t assist with that request.
Você pode encontrar clientes de alto patrimônio líquido que são possivelmente "mercenários" para hackers norte-coreanos
A Chaos Labs sai do mercado, e a Aave perde seu último guardião do risco
A computação quântica não vai matar o Bitcoin, mas os riscos reais estão se aproximando
A Coinbase classifica o x402 como neutro, enquanto o Stripe continua a apostar em ambos os lados fora do MPP.
Balancer Labs Fecha as Portas Após Exploit de $128M
Balancer Labs encerra operações corporativas após um exploit de $128 milhões em novembro de 2025. O ataque foi…
Previsão de Preço do XRP: Fundamentos em Alta, Preço Estagnado
XRP enfrenta um descompasso entre fundamentos sólidos e uma resposta de mercado decepcionante, com o preço caindo mais…
