Claude Code apaga 2 anos e meio de registros de sites em um instante

Com a popularização a Inteligência Artificial agêntica, muitas histórias têm surgido sobre bots que deram errado. Muitas até vêm acompanhadas de lições de moral sobre o atual estágio de desenvolvimento deles. Outras, porém, refletem erros que podem ser atribuídos à supervisão inadequada.

Esse foi o caso de Alexey Grigorev, que teve a coragem de detalhar como fez com que Claude Code apagasse anos de registros de um site, incluindo os snapshots de recuperação.

Notícias Relacionadas:

Tragicômico

Créditos: Anthropic.

A história começa quando Grigorev quis migrar seu site, AI Shipping Labs, para a AWS e compartilhar a mesma infraestrutura do DataTalks.Club. O próprio Claude o desaconselhou, mas Grigorev considerou que não valia a pena o incômodo ou o custo de manter duas configurações separadas.

Gregory usa o Terraform, um utilitário de gerenciamento de infraestrutura que pode criar (ou destruir) configurações inteiras, incluindo redes, balanceamento de carga, bancos de dados e, naturalmente, os próprios servidores.

Ele pediu a Claude que executasse um plano do Terraform para configurar o novo site. O problema é que ele se esqueceu de enviar um arquivo de estado vital que contém uma descrição completa da configuração em qualquer momento.

Créditos: Anthropic.

Claude fez o que Gregory pediu e criou uma configuração para o site da Shipping Labs. No entanto, o operador interrompeu o processo no meio. E, como faltava o arquivo de estado, recursos duplicados foram criados.

Então, Gregory pediu a Claude que identificasse os recursos duplicados para corrigir a situação e, em seguida, carregou o arquivo de estado, acreditando ter resolvido o problema.

Problema

Créditos: Anthropic.

Gregory assumiu que o bot continuaria a limpar os recursos duplicados e, só então, analisaria o arquivo de estado para verificar como a configuração deveria ter sido feita desde o início. O Terraform e ferramentas similares podem ser muito implacáveis, principalmente quando usados com obediência cega.

Porém, como Claude agora tinha o arquivo de estado, o bot seguiu as instruções, executando uma operação “destroy” do Terraform para preparar a configuração correta desta vez.

O problema é que, considerando que a descrição da infraestrutura incluía o site DataTalks.Club, o resultado foi a perda completa da configuração de ambos os sites, incluindo um banco de dados com 2 anos e meio de registros e snapshots do banco de dados que Grigorev considerava backups.

Para resolver o problema, o operador precisou entrar em contato com o suporte da Amazon Business, que ajudou a restaurar os dados em cerca de um dia.

Moral da História

Analisando o ocorrido, Gregory descreveu algumas medidas que está tomando para evitar incidentes semelhantes no futuro. E compartilhou no seu site para que outros pudessem aprender com o seu erro.

Essas medidas incluem a configuração de um período de teste para restauração do banco de dados, a aplicação de proteções de exclusão às permissões do Terraform e da AWS e a migração do arquivo de estado do Terraform para o armazenamento S3 em vez de sua máquina local.

Ele também admitiu que “confiou demais no agente de IA para executar comandos do Terraform” e, agora, está impedindo que o agente faça isso. Ele também está revisando manualmente cada plano apresentado por Claude para que ele mesmo possa executar quaisquer ações destrutivas.

Por fim, provável que a maior lição seja algo que muitos usuários de IAs já sabem: não se pode presumir que elas possuem o contexto para entender o significado da existência, no caso, do segundo site.

Fonte: Alexey on Data.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima