Seis das maiores empresas de tecnologia do mundo formalizaram uma aliança para mudar os rumos de como os aceleradores de inteligência artificial se comunicam dentro dos Data Centers através de conexão óptica.
AMD, Broadcom, Meta, Microsoft, NVIDIA e OpenAI anunciaram a criação do OCI MSA (Optical Compute Interconnect Multi-Source Agreement), um consórcio dedicado a desenvolver uma especificação aberta de interconexão óptica para clusters de IA, com capacidade prevista de até 3,2 Tb/s por fibra.
Por que o Cobre está com os dias contados
A motivação para a iniciativa parte de uma limitação física que vem se tornando cada vez mais urgente à medida que os modelos de linguagem crescem em escala.
A conectividade baseada em Cobre, que por décadas foi suficiente para interligar processadores dentro de racks, está atingindo seu teto em termos de alcance físico e consumo de energia… E isso está afetando diretamente a capacidade de escalar domínios de IA em clusters de múltiplos racks.
A transição para fibra óptica nos chamados links de scale-up (aqueles que conectam aceleradores e switches dentro de um mesmo domínio de computação) é o que o OCI MSA propõe padronizar.
Diferentemente das conexões ópticas de scale-out, que já são comuns entre racks separados, os links de scale-up historicamente dependiam de Cobre por questões de custo, latência e integração.
A proposta do consórcio é criar uma camada física óptica comum (PHY) que funcione com diferentes protocolos, como o UALink (suportado por AMD e Broadcom) e o NVLink (da NVIDIA), sobre a mesma infraestrutura de fibra e switches de fornecedores distintos.
O roadmap técnico em detalhes
A especificação OCI combina modulação NRZ (Non-Return to Zero) com multiplexação por divisão de comprimento de onda (WDM), e está estruturada em gerações:
| Geração | Configuração | Velocidade |
|---|---|---|
| OCI GEN1 | 4 comprimentos de onda × 50 Gb/s | 200 Gb/s por direção |
| OCI GEN2 | BiDi 400 Gb/s por direção | até 800 Gb/s por fibra |
| Roadmap futuro | Escala de wavelengths e data rates | até 3,2 Tb/s por fibra e além |
A especificação abrange três formatos de módulos ópticos: plugáveis, on-board e co-packaged optics (CPO), esta última integrada diretamente ao silício de computação.
O modelo CPO é bastante relevante para a próxima geração de chips de IA, pois elimina a distância entre o processador e a interface óptica, reduzindo latência e consumo.
O que diferencia o OCI MSA de outros consórcios
A estrutura do OCI MSA foge do padrão habitual de grupos como o Ultra Ethernet Consortium ou o JEDEC, que reúnem dezenas ou centenas de empresas em processos longos de consenso.
O modelo MSA foi escolhido justamente por ser mais ágil: um número menor de players alinhados em interfaces elétricas e ópticas consegue desenvolver e lançar produtos interoperáveis com muito mais velocidade.
Mais um diferencial é que o consórcio é liderado pelos hyperscalers, não pelos fabricantes de hardware. Meta, Microsoft e OpenAI estão na mesa como fundadores, o que significa que as especificações partem das necessidades reais de quem opera os maiores clusters de IA do mundo, e não de quem vende componentes para eles.
O posicionamento de cada empresa ficou claro nos comunicados oficiais:
O apetite por tecnologia que resolva as restrições de energia e custo no design de clusters de IA é real e urgente. Incentivamos a adoção do protocolo OCI para desacoplar a necessidade de domínios de scale-up maiores das limitações dos backplanes elétricos em clusters de IA de alto desempenho.
Dan Rabinovitsj, vice-presidente de Hardware Systems da Meta
Richard Ho, responsável pelo hardware na OpenAI, conectou a iniciativa ao objetivo mais amplo da empresa:
A melhoria contínua da inteligência artificial depende da escala dos supercomputadores de IA, com mais petaflops, mais largura de banda de memória e, principalmente, mais largura de banda de rede em domínios maiores que exigem maior alcance. O OCI MSA será fundamental para permitir que a indústria construa os sistemas de IA que nos levarão à AGI
AMD, Broadcom e NVIDIA do mesmo lado da mesa
A presença simultânea de AMD, Broadcom e NVIDIA no mesmo consórcio é, por si só, uma sinalização relevante. As três empresas competem diretamente no mercado de aceleradores e chips de rede para IA, e cada uma defende protocolos próprios de interconexão.
O fato de concordarem em compartilhar uma camada física comum indica que o problema da conectividade óptica é grande o suficiente para que a cooperação faça mais sentido do que a fragmentação.
Saurabh Dighe, vice-presidente corporativo de Azure Systems and Architecture na Microsoft, resumiu a lógica da iniciativa ao afirmar que tecnologias ópticas voltadas para scale-up são a base para construir domínios de computação de IA de alto desempenho em múltiplos racks,e que a especificação do OCI MSA abre caminho para padrões abertos com implementações diferenciadas.
Leia também:
- Startup quer usar computador biológico com células cerebrais para reduzir consumo de energia da IA
- Vice-presidente de software de IA da AMD criou código inteiro usando só o Claude Code
- NVIDIA aposta em infraestrutura aberta para dominar a era do 6G
A fibra como infraestrutura universal da próxima geração de IA
A criação do OCI MSA é um sinal evidente de que a indústria reconhece que a arquitetura dos Data Centers de IA precisa mudar de base antes que os modelos de próxima geração simplesmente não caibam mais na infraestrutura atual.
Quando OpenAI menciona AGI no contexto de uma especificação de interconexão, a mensagem implícita é que chegar lá depende tanto de fibra e fótons quanto de parâmetros e gradientes.
Fonte(s): Business Wire