O processamento de IA em larga escala para uso profissional não vive só de avanços em GPUs e outros tipos de aceleradores de inferência. A rede de conexão entre os componentes é igualmente importante, e é por isso que a AMD apresentou a Pensando Pollara, primeira placa de rede no mundo certificada para o padrão Ultra Ethernet.
A Ultra Ethernet se tornou um padrão oficial nesta semana, com a publicação da especificação 1.0 da tecnologia pelo novo consórcio de empresas responsáveis pelo seu desenvolvimento. Assim, a AMD chega na frente com o primeiro componente dedicado, na forma da Pensando Pollara, que entrega até 400Gbps.
Esse tipo de NIC (Network Interface Card) é voltado para sistemas de escala gigantesca, preparando-se para até um milhão de GPUs ou outros tipos de aceleradores de IA trabalhando em conjunto.
A nova placa da AMD é baseada em um design da própria empresa, com hardware customizável para suportar RDMA, protocolos ajustáveis de transporte e aceleração de bibliotecas de comunicação.
AMD faz comparativos com a Pensando Pollara
Não foi apenas com palavras que a AMD revelou sua primeira NIC para Ultra Ethernet. A empresa também ofereceu alguns comparativos de performance.
Segundo a AMD, a Pensando Pollara entrega até 20% mais performance em RDMA do que “as concorrentes”, o que inclui a NIC CX7 da NVIDIA e a Thor2, da Broadcom. A placa se mostra melhor em um comparativo direto de RCCL usando RoCEv2:

Além disso, a empresa ressalta que o novo recurso UEC 1.0 incrementa consideravelmente a performance em relação ao RoCEv2, entregando até 25% a mais com a sua NIC mais recente:

Serviço da Oracle marca estreia da nova placa
A Oracle é a primeira empresa a adotar a nova NIC da AMD. A empresa fez o anúncio junto com sua parceira, promovendo seu serviço Oracle Cloud Infrastructure (OCI), que oferece computação em nuvem para clientes.
Leia mais:
- Oracle vai investir US$ 40 bilhões em 400 mil GPUs NVIDIA como parte do projeto Stargate
- Solução da NVIDIA prepara redes Ethernet para IA generativa
- AMD conquista primeiro e segundo lugares na lista dos supercomputadores mais poderosos do mundo
Segundo as companhias, a Pensando Pollara começará a ser usada no serviço logo na segunda metade deste ano. Além disso, a NIC deve ser implementada em um novo cluster para IA em escala zetta, que a Oracle prepara com até 131.072 unidades das novas GPUs Instinct MI355X da AMD. A empresa pretende oferecer serviços de treinamento de IA em hardware AMD para seus clientes em larga escala.
Via: Tom’s Hardware