AMD apresenta ROCm 7 e promete triplicar performance para IA em hardware atual

O evento Advancing AI 2025 da AMD não foi de poucos anúncios. Um dos grandes destaques da empresa veio para o ROCm 7, versão mais recente de seu software stack para trabalho com IA. Entre as novidades, a empresa promete uma média de 3,5 vezes mais performance em modelos de IA, apenas por atualizar a plataforma.

Um dos grandes fatores que mais atrapalha a AMD em sua competição com a NVIDIA no segmento profissional de IA é o ecossistema CUDA, preferido pela maioria das empresas. Por isso, a dona das Radeon preparou avanços consideráveis com o ROCm 7:

Fonte: AMD

A tabela abaixo mostra os ganhos de desempenho com a atualização em GPUs Instinct MI300X. Ou seja, só de passar para a nova versão do ROCm, a performance de inferência em modelos de IA mais do que triplica. O desempenho em treinamento também tem um ganho expressivo:

Ganhos em treinamento de IA no ROCm 7
Fonte: AMD

Evidentemente, gráficos de performance oferecidos pela própria dona do produto geralmente representam os cenários mais otimistas possíveis. Usando o ROCm 7 e sua GPU mais nova, a Instinct MI355X, a AMD demonstra 30% a mais de desempenho no DeepSeek R1 do que as B200 com CUDA:

MI355X  vs B200 em DeepSeek R1
Fonte: AMD

ROCm 7 também traz suporte ao uso “doméstico”

Outra novidade interessante do ROCm 7 é que agora o stack suporta GPUs Radeon no Windows. E isso vale tanto para placas de vídeo dedicadas como gráficos integrados em APUs.

Dessa forma, a partir do segundo semestre de 2025, usuários de PCs poderão tentar usar LLMs para IA localmente em seus sistemas. No entanto, é necessário que o processador também seja AMD Ryzen.

Leia mais:

Importante mencionar que, depois de críticas da demora da AMD em adicionar suporte para RDNA 4 ao ROCm, a compatibilidade veio no ROCm 6.4.1, logo em seguida da participação da AMD na Computex 2025.

AMD estende seu suporte para inferência de IA

Além dos avanços em performance e suporte para PCs, o ROCm 7 traz um conjunto de novos recursos para treinamento de IA e expande muito suas capacidades para inferência com a tecnologia.

Novidades do ROCm 7
Fonte: AMD

A AMD destaca melhorias em frameworks e novos recursos de paralelização. Além disso, a nova versão do ROCm 7 pode lidar com dados avançados em FP8, FP6, FP4 e de precisão mista.

AMD destaca recursos de seu software stack
Fonte: AMD

O software stack já está disponível na forma de prévia para desenvolvedores e deve ter sua disponibilidade cada vez mais abrangente ao longo do ano.

Fontes: VideoCardz, Tom’s Hardware

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima