Você vem treinando a IA do Google de graça há 15 anos, e nem sabia disso
Título original: Você vem treinando a IA do Google há 15 anos. Você nem imaginava.
Autor original: Sharbel, cofundador da Unfungible
Tradutor original: Lila, BlockBeats
Nota do editor: O CAPTCHA, aqueles números ou imagens nos quais você precisa clicar sempre que faz login em um site, é conhecido por todos os usuários da Internet. Mas quando você clica em “Não sou um robô” repetidamente, pode pensar que está apenas confirmando sua identidade, quando, na verdade, está participando da maior e mais secreta produção de dados do mundo. O reCAPTCHA, de Luis von Ahn, reuniu comportamentos humanos dispersos em uma base de dados fundamental para o Google e sua subsidiária, a empresa de veículos autônomos Waymo.
Por trás da fachada de "gratuito" e "seguro", a Internet silenciosamente moldou uma nova forma de relação de trabalho: você gasta tempo provando que é humano, mas, na verdade, está contribuindo para o treinamento da IA; e, assim que a IA aprende, esse trabalho é completamente substituído. Este artigo recebeu mais de 9,5 milhões de visualizações no Twitter em menos de 20 horas. Segue abaixo o conteúdo original:
Aproximadamente 500 mil horas de trabalho humano são exploradas gratuitamente pelo Google todos os dias. E as pessoas que estão contribuindo para isso só querem acessar o banco online.
O reCAPTCHA é a operação invisível de dados de maior sucesso da história da Internet. No auge, 200 milhões de pessoas concluíam o processo de verificação todos os dias. Mas quase ninguém percebia o que cada clique significava nos bastidores.
A Waymo, empresa de carros autônomos do Google, está avaliada atualmente em US$ 45 bilhões. E a maior parte dos dados essenciais para o treinamento é fornecida gratuitamente por você ao acessar diversos sites.
Aqui está a história completa:
Origem: Uma ideia inteligente
Em 2000, os robôs de spam estavam causando estragos na Internet. Os fóruns estavam inundados, as caixas de entrada estavam transbordando e os sites precisavam de uma maneira de distinguir entre humanos e máquinas.
O professor Luis von Ahn, da Universidade Carnegie Mellon, resolveu esse problema. Ele inventou o CAPTCHA: texto distorcido que só os humanos conseguiam ler, e não os robôs.
Mas von Ahn viu mais do que isso. Milhões de pessoas dedicaram suas energias a esses desafios. E se essa energia pudesse fazer duas coisas ao mesmo tempo?
Em 2007, ele lançou o reCAPTCHA. O que é genial: já não exibe texto aleatório e ilegível, mas sim duas palavras. Uma palavra era conhecida pelo sistema, a outra era uma palavra real de um livro digitalizado que os computadores ainda não conseguiam reconhecer. E a sua resposta ajudou na digitalização desses livros.
Esses livros foram extraídos dos arquivos do The New York Times e do Google Livros, totalizando 130 milhões.
Você pensava que estava apenas acessando um site comum, mas, na verdade, estava realizando um OCR (Reconhecimento Ótico de Caracteres) para a maior biblioteca digital do mundo.
Em 2009, o Google adquiriu oficialmente o reCAPTCHA.

Mais tarde, o Google revolucionou o mercado
A era do “texto distorcido” chegou ao fim por volta de 2012.
O Google enfrentou um novo desafio: Os carros do Street View já haviam fotografado todas as ruas do mundo, mas as imagens eram apenas dados brutos. Para que a IA pudesse fazer sua mágica, ela precisava entender o que via: sinais de trânsito, faixas de pedestres, semáforos, fachadas de lojas.
Então, o Google reformulou o reCAPTCHA v2. Em vez de texto distorcido, havia grades de fotos. "Clique em todos os quadrados com semáforos." "Selecione todas as faixas de pedestres." "Identifique as fachadas das lojas."
Essas imagens foram obtidas diretamente do Google Street View. Seus cliques serviram como tags.
Cada seleção alimentava o modelo de visão computacional do Google: esses pixels formam um semáforo, aquela forma é uma faixa de pedestres. Você não estava fazendo um teste; estava criando um conjunto de dados.

Uma escala inimaginável
No auge, eram resolvidos 200 milhões de reCAPTCHAs por dia. Cada desafio levava 10 segundos, o que significa 2 bilhões de segundos de trabalho humano por dia. Isso dá 500 mil horas por dia.
O custo do trabalho remunerado de rotulagem de dados varia entre US$ 10 e US$ 50 por hora. Calculado com base na taxa mais baixa: o valor diário do trabalho extraído gratuitamente chegou a atingir US$ 5 milhões.
Além disso, o reCAPTCHA não está presente apenas em um aplicativo específico. Está presente em todos os bancos, em todos os portais governamentais e em todos os sites de comércio eletrônico. Você não tem escolha: Quer fazer login na sua conta? Primeiro, ajude a anotar o conjunto de dados. O Google nunca pediu sua opinião, nunca lhe pagou um centavo de salário, nem mesmo lhe contou nada sobre isso.

A que tudo isso levou?
Esses dados são utilizados diretamente em dois produtos:
-Google Maps: A ferramenta de navegação mais utilizada em todo o mundo. Sua capacidade de reconhecer sinais de trânsito, lojas e a geografia da cidade deve-se, em parte, aos bilhões de anotações feitas por pessoas durante o acesso a sites.
-Waymo: O projeto de veículos autônomos do Google. Para uma navegação segura, os veículos autônomos precisam identificar com quase total precisão milhares de padrões visuais.
Os dados de treinamento de referência para esse trabalho de identificação são exatamente aqueles que milhões de pessoas, sem saber, anotaram por meio do reCAPTCHA. A Waymo realizou mais de 4 milhões de viagens pagas em 2024, no valor de US$ 45 bilhões. Sua pedra fundamental, lançada por aqueles “usuários da internet não remunerados” que só queriam verificar seus e-mails.
Por que ninguém consegue reproduzir esse modelo?
A anotação de dados é extremamente cara. Empresas como a Scale AI, a Appen e a Labelbox existem para resolver esse problema; elas contratam centenas de milhares de trabalhadores, às vezes pagando menos de US$ 1 por hora.
O Google adotou uma abordagem diferente para o problema: transformou a anotação em um requisito. Não é necessário pagar nem dar consentimento, mas serve como um “bilhete” para acessar todos os cantos da internet. O resultado: bilhões de imagens rotuladas, cobertura global, em todas as condições climáticas, em todas as cidades do mundo. Nenhuma empresa de anotação consegue fazer isso. A própria internet é uma fábrica, e cada internauta é um funcionário sem contrato.

Você ainda está participando
O reCAPTCHA v3, lançado em 2018, nem sequer exibe mais os desafios. Ele monitora como você move o mouse, a velocidade de rolagem e o tempo de permanência. Sua assinatura comportamental indica se você é humano. Esses dados comportamentais também são incorporados aos sistemas de IA do Google.
Você nunca escolheu ativamente participar, nunca teve uma caixa de seleção para marcar. No entanto, neste momento, na maioria dos sites que você visita, você ainda está fazendo isso.
Uma ironia perturbadora
A intenção original de Luis von Ahn era brilhante: transformar a energia que as pessoas já desperdiçavam em algo útil. No entanto, o que o Google fez com essa visão é uma história completamente diferente. Eles pegaram um mecanismo de segurança que os usuários eram obrigados a usar, implementaram-no na web e aproveitaram os resultados para criar um produto comercial avaliado em centenas de bilhões de dólares. Os usuários não receberam nada em troca, nem mesmo reconhecimento.
A ironia mais profunda é esta: você passou anos provando que é humano ao realizar tarefas de reconhecimento visual que a IA não conseguia realizar naquela época. Mas, assim que a IA aprendeu a realizar essas tarefas, as anotações visuais feitas por humanos deixaram de ser necessárias.
Você provou que é humano, mas acabou se tornando dispensável.
Você também pode gostar

Encontrei uma “meme coin” que disparou em poucos dias. Alguma dica?

TAO é Elon Musk, que investiu na OpenAI, e Subnet é Sam Altman

A era da "distribuição em massa de moedas" em cadeias públicas chega ao fim

Com uma valorização de 50 vezes e um FDV superior a 10 bilhões de dólares, por que escolher a RaveDAO?

A lagosta é coisa do passado? Conheça as ferramentas do Hermes Agent que multiplicam sua produtividade por 100

1 bilhão de DOTs foram criados do nada, mas o hacker só conseguiu 230.000 dólares

Após o bloqueio do Estreito de Ormuz, quando terminará a guerra?

Antes de usar o X Chat, o “WeChat ocidental” de Musk, é preciso entender estas três questões
O X Chat estará disponível para download na App Store nesta sexta-feira. A mídia já divulgou a lista de recursos, incluindo mensagens que se autodestruem, bloqueio de capturas de tela, conversas em grupo para até 481 pessoas, integração com o Grok e cadastro sem número de telefone, posicionando-o como o “WeChat ocidental”. No entanto, há três questões que quase não foram abordadas em nenhum relatório.
Há uma frase na página de ajuda oficial do X que ainda está lá: "Se funcionários mal-intencionados ou a própria X fizerem com que conversas criptografadas sejam expostas por meio de processos judiciais, nem o remetente nem o destinatário terão a menor ideia do que está acontecendo."
Não. A diferença está no local onde as chaves são armazenadas.
Na criptografia de ponta a ponta do Signal, as chaves nunca saem do seu dispositivo. Nem a X, nem o tribunal, nem qualquer outra parte externa possui suas chaves. Os servidores do Signal não possuem nada que permita descriptografar suas mensagens; mesmo que fossem intimados, eles só poderiam fornecer os carimbos de data e hora do registro e os horários das últimas conexões, conforme comprovado por registros de intimações anteriores.
O X Chat utiliza o protocolo Juicebox. Essa solução divide a chave em três partes, cada uma armazenada em um dos três servidores operados pela X. Ao recuperar a chave com um código PIN, o sistema busca esses três fragmentos nos servidores da X e os recombina. Por mais complexo que seja o código PIN, é a X quem detém a chave, e não o usuário.
Este é o contexto técnico da "frase da página de ajuda": como a chave está nos servidores da X, a X tem a capacidade de responder a processos judiciais sem o conhecimento do usuário. O Signal não possui essa funcionalidade, não por uma questão de política, mas simplesmente porque não possui a chave.
A ilustração a seguir compara os mecanismos de segurança do Signal, WhatsApp, Telegram e X Chat em seis aspectos. O X Chat é o único dos quatro em que a plataforma detém a chave e o único sem sigilo direto.
A importância da confidencialidade prospectiva reside no fato de que, mesmo que uma chave seja comprometida em determinado momento, as mensagens anteriores não podem ser descriptografadas, pois cada mensagem possui uma chave exclusiva. O protocolo Double Ratchet do Signal atualiza automaticamente a chave após cada mensagem, um mecanismo que não existe no X Chat.
Após analisar a arquitetura do XChat em junho de 2025, Matthew Green, professor de criptologia da Universidade Johns Hopkins, comentou: “Se considerarmos o XChat como um esquema de criptografia de ponta a ponta, essa vulnerabilidade parece ser do tipo que põe fim ao jogo.” Mais tarde, ele acrescentou: "Não confiaria nisso mais do que confio nas mensagens diretas não criptografadas atuais."
Desde uma reportagem da TechCrunch de setembro de 2025 até sua entrada em operação em abril de 2026, essa arquitetura não sofreu alterações.
Em um tuíte publicado em 9 de fevereiro de 2026, Musk comprometeu-se a submeter o X Chat a rigorosos testes de segurança antes de seu lançamento na plataforma e a disponibilizar todo o código como código aberto.
Até a data de lançamento, em 17 de abril, nenhuma auditoria independente por terceiros havia sido concluída; não há um repositório oficial de código no GitHub; e o selo de privacidade da App Store revela que o X Chat coleta cinco ou mais categorias de dados, incluindo localização, informações de contato e histórico de pesquisa, o que contradiz diretamente a afirmação de marketing de “Sem anúncios, sem rastreadores”.
Não se trata de um monitoramento contínuo, mas de um ponto de acesso claro.
Para qualquer mensagem no X Chat, os usuários podem manter pressionado e selecionar “Perguntar ao Grok”. Quando esse botão é clicado, a mensagem é enviada ao Grok em texto simples, passando do formato criptografado para o não criptografado nessa etapa.
Esse projeto não é uma vulnerabilidade, mas sim uma característica. No entanto, a política de privacidade do X Chat não especifica se esses dados em texto simples serão utilizados para o treinamento do modelo do Grok ou se o Grok armazenará o conteúdo dessas conversas. Ao clicar em “Perguntar ao Grok”, os usuários estão removendo voluntariamente a proteção de criptografia dessa mensagem.
Há também uma questão estrutural: Em quanto tempo esse botão deixará de ser um “recurso opcional” para se tornar um “hábito padrão”? Quanto melhor for a qualidade das respostas do Grok, mais os usuários passarão a confiar nele, o que levará a um aumento na proporção de mensagens que saem da proteção de criptografia. A real robustez da criptografia do X Chat, a longo prazo, depende não apenas do design do protocolo Juicebox, mas também da frequência com que os usuários clicam em “Ask Grok”.
A versão inicial do X Chat é compatível apenas com iOS, enquanto a versão para Android indica apenas “em breve”, sem especificar uma data.
No mercado global de smartphones, o Android detém cerca de 73%, enquanto o iOS detém cerca de 27% (IDC/Statista, 2025). Dos 3,14 bilhões de usuários ativos mensais do WhatsApp, 73% utilizam o Android (segundo a Demand Sage). Na Índia, o WhatsApp conta com 854 milhões de usuários, com uma penetração do Android superior a 95%. No Brasil, há 148 milhões de usuários, dos quais 81% utilizam o Android, e na Indonésia, há 112 milhões de usuários, dos quais 87% utilizam o Android.
O domínio do WhatsApp no mercado global de comunicações se baseia no Android. O Signal, com uma base de usuários ativos mensais de cerca de 85 milhões, também conta principalmente com usuários preocupados com a privacidade em países onde o Android é predominante.
O X Chat contornou esse campo de batalha, o que pode ser interpretado de duas maneiras. Um deles é a dívida técnica; o X Chat foi desenvolvido em Rust, e conseguir compatibilidade multiplataforma não é fácil, portanto, priorizar o iOS pode ser uma limitação de engenharia. A outra é uma escolha estratégica; com o iOS detendo uma participação de mercado de quase 55% nos EUA, e considerando que a base de usuários principal do X está nos EUA, priorizar o iOS significa concentrar-se nessa base de usuários, em vez de entrar em concorrência direta com os mercados emergentes dominados pelo Android e com o WhatsApp.
Essas duas interpretações não se excluem mutuamente, levando ao mesmo resultado: Com o seu lançamento, o X Chat abriu mão voluntariamente de 73% da base global de usuários de smartphones.
Este assunto já foi descrito por alguns: O X Chat, juntamente com o X Money e o Grok, forma um trio que cria um sistema de dados em circuito fechado paralelo à infraestrutura existente, semelhante em conceito ao ecossistema do WeChat. Essa avaliação não é nova, mas com o lançamento do X Chat, vale a pena revisitar o esquema.
O X Chat gera metadados de comunicação, incluindo informações sobre quem está conversando com quem, por quanto tempo e com que frequência. Esses dados são enviados para o sistema de identidade da X. Parte do conteúdo da mensagem passa pelo recurso “Ask Grok” e entra na cadeia de processamento do Grok. As transações financeiras são processadas pela X Money: os testes públicos externos foram concluídos em março, com o lançamento ao público ocorrendo em abril, permitindo transferências p2p-211">ponto a ponto de moeda fiduciária via Visa Direct. Um alto executivo da Fireblocks confirmou os planos para que os pagamentos em criptomoedas entrem em operação até o final do ano, já que a empresa possui licenças de operadora de transferência de valores em mais de 40 estados dos EUA atualmente.
Todos os recursos do WeChat operam dentro do quadro regulatório da China. O sistema de Musk opera dentro dos marcos regulatórios ocidentais, mas ele também ocupa o cargo de chefe do Departamento de Eficiência Governamental (DOGE). Isso não é uma réplica do WeChat; é uma reprodução da mesma lógica em condições políticas diferentes.
A diferença é que o WeChat nunca afirmou explicitamente, em sua interface principal, que possui "criptografia de ponta a ponta", ao passo que o X Chat o faz. Na percepção do usuário, a "criptografia de ponta a ponta" significa que ninguém, nem mesmo a plataforma, pode ver suas mensagens. O projeto arquitetônico do X Chat não atende a essa expectativa dos usuários, mas utiliza esse termo.
O X Chat concentra nas mãos de uma única empresa as três vertentes de informação: “quem é essa pessoa, com quem ela está falando e de onde vem e para onde vai o dinheiro dela”.
O texto da página de ajuda nunca se limitou a ser apenas instruções técnicas.

A versão beta recém-lançada do Parse Noise: como aproveitar essa novidade "na cadeia"?

Declarar guerra à IA? A narrativa do Juízo Final por trás da Residência em Chamas do Ultraman

Os VCs de criptomoedas estão mortos? O ciclo de extinção do mercado começou

A Jornada de Claude para a Tolosidade em Diagramas: O Custo da Economia, ou Como a Fatura da API Aumentou 100 Vezes

Regressão da Terra de Borda: Uma revisão sobre o poder marítimo, a energia e o dólar

Última entrevista com Arthur Hayes: Como os investidores de varejo devem lidar com o conflito no Irã?

Há pouco, Sam Altman foi atacado novamente, desta vez a tiros

Straits Blockade, Stablecoin Recap | Rewire Notícias Edição da manhã

Governador da Califórnia Assina Ordem para Banir Insider Trading em Mercados de Previsão
O Governador da Califórnia, Gavin Newsom, assinou uma ordem executiva para coibir o uso de informações privilegiadas em…

