O novo driver de GPU Arc Pro da Intel permite que os usuários aloquem até 93% da RAM do sistema para a GPU integrada. A atualização vem com a versão 32.0.101.8517, para os que quiserem conferir o número, permitindo um suporte mais amplo à inferência LLM.
Atualmente, o driver suporta apenas um número seleto de SKUs. Porém, o time azul está abrindo caminho para cargas de trabalho de inferência LLM maiores sem atingir gargalos de capacidade de memória.
O particionamento de memória tradicional geralmente limita uma GPU a 50% da RAM do sistema.
No caso da AMD, a Memória Gráfica Variável (VGM) permite que configurações de ponta, como a Strix Halo, aloquem 96 GB de um pool de 128 GB para a iGPU.
Isso demonstra que a Intel, claramente, está usando uma abordagem mais agressiva nesse aspecto. Inclusive, no ano passado, a Intel elevou o limite para 87% com seu novo recurso “Shared GPU Memory Override” para processadores Core Ultra Series 2.
Notícias Relacionadas:
- Microsoft lança Shader Model 6.10 e AgilitySDK 720 com novidades para IA e DX12
- Fuga de talentos? Ex-AMD afirma que time do FidelityFX agora está na NVIDIA e Intel
- PC completo Alienware Area-51 agora inclui Ryzen 9 9950X3D2, começando em US$ 4.450
GPUs Arc Pro integradas

Esta atualização suporta apenas GPUs Arc Pro integradas, como a Arc Pro B390 e a Arc Pro B370. Embora essa atualização de alocação seja o principal recurso exclusivo para GPUs integradas, o driver também é compatível com placas Arc Pro das séries A e B.
Falando dos benefícios, isso permite que os usuários executem modelos LLM muito maiores sem hardware caro.
Trazendo para números, em um sistema de 32 GB, essa alocação fornece memória suficiente para executar um modelo Qwen 2.5 de 32 bits com quantização de 4 bits e uma janela de contexto adequada.
Já estações de trabalho equipadas com 64 GB de RAM podem executar modelos complexos como o Llama 3 de 70 bits, com margem suficiente para o cache KV e a estabilidade do sistema.
Outros gargalos
Embora isso seja impressionante, o poder computacional e a largura de banda ainda afetam o tempo de execução do modelo. Os chips Intel Core Ultra Series 3 (Panther Lake) contam com memória LPDDR5X-9600 de alta velocidade, oferecendo largura de banda na faixa de 150 GB/s.
A arquitetura Strix Halo da AMD, por outro lado, possui um barramento de memória de 256 bits que oferece 256 GB/s de largura de banda. E isso garante que modelos grandes não apenas caibam na memória, mas também operem em velocidades respeitáveis.

Porém, o Apple Silicon continua sendo o padrão ouro. O M5 Max oferece 614 GB/s de largura de banda, mas sua verdadeira vantagem reside na Arquitetura de Memória Unificada (UMA).
Ela ignora o particionamento tradicional encontrado no mundo x86, onde, em vez de definir um limite rígido ou uma barreira, todo o pool de memória é nativamente acessível tanto à CPU quanto à GPU.
Fonte: Intel.