NVIDIA diz que GPUs antigas “envelheceram como vinho” após explosão da demanda por IA

As GPUs antigas da NVIDIA agora estão mais caras do que quando foram lançadas, e o CEO Jensen Huang resolveu cunhar uma frase para resumir o fenômeno.

Em comentários divulgados nesta semana, o executivo afirmou que os chips vendidos pela companhia há quatro ou cinco anos estão valorizando mais rápido do que um bom vinho, e que comprar uma placa da empresa hoje virou algo parecido com investir em arte. A declaração foi feita em meio à corrida bilionária por capacidade computacional para treinar e operar modelos de inteligência artificial.

A prática não é nova, mas o tom é: a expressão fine wine circula há anos no mercado de placas de vídeo e, originalmente, descrevia o comportamento das Radeon da AMD, que melhoravam de desempenho com o tempo conforme os drivers amadureciam.

Agora a metáfora foi requentada pelo lado oposto: o chip não fica mais rápido com o passar dos anos, ele fica mais caro.

Hopper virou ativo escasso, não geração ultrapassada

Quando Huang fala em GPUs de quatro ou cinco anos, ele se refere principalmente à família Hopper, que reúne os aceleradores H100 e H200.

Diivulgação/NVIDIA

Esse chips deveriam estar perdendo valor a essa altura, deslocados pelos lançamentos mais recentes da arquitetura Blackwell. O que acontece no mercado é o contrário… Cargas de trabalho de inferência continuam exigindo Siício disponível em qualquer geração, e a oferta limitada de wafers, memórias HBM e energia elétrica para os data centers transformou o estoque herdado em recurso disputado.

A geração anterior também segue no radar: a A100, lançada em 2020 com a arquitetura Ampere, foi citada por Huang no mesmo grupo de chips que continuam valorizando. Esses aceleradores costumam migrar do treinamento para a inferência conforme uma nova geração entra em produção, o que prolonga a vida útil comercial deles.

A NVIDIA tem reforçado esse ciclo com atualizações de stack de software e novas otimizações que mantêm os chips relevantes para cargas atuais de IA generativa.

Diivulgação/NVIDIA

CoreWeave confirma alta sequencial em quatro famílias

A fala de Huang ganhou peso adicional porque foi acompanhada de um sinal vindo de quem opera essas placas em escala.

Em sua teleconferência referente ao primeiro trimestre de 2026, divulgada em 7 de maio, a CoreWeave confirmou que os preços médios cobrados por hora pelos aceleradores A100, H100, H200 e L40S subiram em comparação com o trimestre anterior.

O CEO Mike Intrator declarou que a empresa segue praticamente sem capacidade disponível no curto prazo, e que a inferência já responde por mais de 50% do consumo computacional:

“Atender essa variedade de clientes e cargas de trabalho exige uma combinação de gerações novas e anteriores de GPUs NVIDIA à medida que a demanda por inferência dispara e os agentes entram no mercado de trabalho. Como resultado, a demanda está acelerando em todas as frentes. O preço médio dos A100, H100, H200 e L40 subiu em todas as linhas no comparativo trimestral, e seguimos largamente esgotados na capacidade de curto prazo da nossa frota.”

Os números reportados ajudam a dimensionar a pressão; a CoreWeave fechou o trimestre com receita de US$ 2,1 bilhões, alta de 112% na comparação anual, e um backlog contratado próximo de US$ 99,4 bilhões, segundo o balanço consolidado pela empresa.

A companhia também ampliou a base de clientes com compromissos superiores a US$ 1 bilhão, agora em 10 contas, e fechou um acordo de US$ 21 bilhões com a Meta em abril.

Divulgação/NVIDIA

Preço por hora subiu, e estoque secundário acompanha

No varejo de nuvem, a alta também aparece nos serviços públicos. Levantamentos recentes mostram que o preço médio por hora de uma H100 sob demanda subiu cerca de 10% no último ano, passando de US$ 3,35 para US$ 3,70 por GPU/hora (aproximadamente R$ 18,25 na cotação atual, sem considerar impostos brasileiros e taxas de importação).

Configurações de 8 GPUs HGX H100 oferecidas pela CoreWeave foram listadas perto de US$ 49,24 por hora, o equivalente a algo na casa de R$ 242,75 por hora no câmbio comercial.

Acelerador Arquitetura Ano de lançamento Movimento de preço
A100 80GB Ampere 2020 Alta sequencial em contratos
H100 Hopper 2022 Alta de ~10% em 12 meses no spot
H200 Hopper 2024 Alta sequencial em contratos
L40S Ada Lovelace 2023 Alta sequencial em contratos

A pressão é tão difundida que até hardware antigo voltou à pauta: a NVIDIA V100, com oito anos de mercado, vem sendo redescoberta para uso em LLMs locais a preços a partir de US$ 100, em um sinal de que mesmo placas obsoletas em ambiente corporativo encontraram um novo público.

Falta wafer, falta memória, falta energia

A valorização das placas antigas é só uma face do estrangulamento mais amplo no setor. Fornecedores de wafers operam no limite, fabricantes de memória priorizam clientes de data center e provedores de nuvem competem por energia elétrica em regiões com gargalo de transmissão.

A Samsung e a SK hynix, segundo previsões da Nikkei Asia, devem atender apenas 60% da demanda global por componentes até o final de 2027.

O efeito chega ao consumidor doméstico. A escassez de memórias afetou a produção de GPUs gamer, e a crise de hardware que torna 2026 mais difícil para quem quer montar PC tem a mesma origem: cada wafer alocado para HBM3E ou GDDR7 industrial é um wafer a menos para Crucial, Kingston ou para placas GeForce de varejo.

A própria NVIDIA reconheceu publicamente o problema ao mudar a configuração de algumas GeForce para acomodar a falta de memória, caso da RTX 5070 de 12GB para notebooks anunciada em abril.

A divisão de data centers da empresa registrou cerca de US$ 41 bilhões em receita no último trimestre, contra US$ 4 bilhões da divisão gamer, o que explica a ordem de prioridade.

Divulgação/NVIDIA

Comparação com arte funciona até certo ponto

A frase sobre arte tem um detalhe interessante, já que uma obra de arte se valoriza pela escassez permanente, pela autoria insubstituível e pelo prestígio cultural. Porém, uma GPU, mesmo a mais rara, segue uma curva diferente: ela ganha valor enquanto a demanda por compute superar a oferta de wafers, memória e energia.

Quando a Blackwell estiver plenamente disponível, e mais ainda quando a próxima geração chegar em volume, o preço da Hopper tende a se acomodar.

O problema é que ninguém sabe quando esse momento chegará… Analistas da indústria de memória já projetam normalização apenas em 2028, e o ritmo de adoção de modelos de IA continua superando as projeções dos próprios fornecedores de chip.

Até lá, o estoque de aceleradores instalados em CoreWeave, Lambda, Crusoe, Oracle Cloud e nos hyperscalers funciona como uma reserva de valor estranha, em que cada hora-GPU contratada pesa mais no balanço dos provedores do que pesava há doze meses.

Leia também:

Da depreciação à apreciação

A história da computação foi escrita com base em uma premissa que parece estar suspensa: hardware se desvaloriza com o tempo.

Servidores, switches e aceleradores costumavam virar sucata fiscal em poucos anos, com depreciação contábil rápida e descarte previsível. O ciclo atual quebra essa lógica para uma fatia específica do mercado, e cria uma situação rara em que comprar GPU vira tese de investimento em vez de gasto de capital.

A leitura de Jensen Huang serve a um propósito claro de mensagem aos investidores da própria NVIDIA nem mesmo o lançamento de gerações novas pressiona a base instalada, porque a demanda absorve tudo. Resta saber por quantos trimestres a equação continua válida.

Para os compradores que viam na A100 ou na H100 um chip de fim de vida útil, a conta agora é outra. Em vez de planejar substituição, o cálculo virou retenção, e o mercado secundário de aceleradores virou um dos termômetros mais confiáveis do estado da indústria de infraestrutura de IA.

Fonte(s): The Transcript, CoreWeave (Q1 2026) e BigGo Finance

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima