A NVIDIA revelou durante a GTC 2026, em San Jose (EUA), o NVIDIA Physical AI Data Factory Blueprint, uma arquitetura de referência aberta projetada para acelerar o desenvolvimento de sistemas de robótica, agentes de IA de visão e veículos autônomos.
A proposta da empresa é simplificar e automatizar a geração, ampliação e avaliação de dados de treinamento para modelos de inteligência artificial física.
Segundo a NVIDIA, o projeto busca reduzir custos, tempo de desenvolvimento e complexidade no treinamento de sistemas de IA em larga escala, especialmente aqueles que interagem diretamente com o mundo físico.
A solução também permitirá criar grandes conjuntos de dados sintéticos capazes de simular situações raras ou difíceis de capturar no mundo real.
Arquitetura aberta para geração e curadoria de dados de IA
O Physical AI Data Factory Blueprint funciona como um fluxo completo de produção de dados para treinamento de IA. A arquitetura reúne ferramentas capazes de transformar dados brutos em conjuntos prontos para treinamento de modelos de inteligência artificial.
A plataforma utiliza os modelos de mundo aberto NVIDIA Cosmos e agentes de codificação para ampliar conjuntos de dados existentes, criando novos cenários e variáveis automaticamente. Isso inclui situações de cauda longa — eventos raros ou extremos que normalmente são caros e demorados de registrar em ambientes reais.
Com essa abordagem, desenvolvedores podem transformar quantidades limitadas de dados reais em bases muito maiores e mais diversificadas, o que melhora o treinamento de modelos utilizados em aplicações como robôs industriais, sistemas de visão computacional e carros autônomos.
De acordo com Rev Lebaredian, vice-presidente de Omniverse e tecnologias de simulação da NVIDIA, a produção massiva de dados é um fator essencial para a evolução da chamada IA física.
“A IA física é a próxima fronteira da revolução da IA. Nesta nova era, computação é sinônimo de dados”, afirmou o executivo.
Pipeline completo para treinamento de IA física
O blueprint reúne diferentes ferramentas da NVIDIA em um pipeline automatizado que cobre todas as etapas de preparação de dados.
Entre os principais componentes estão:
- Curadoria e pesquisa: o NVIDIA Cosmos Curator processa, refina e anota grandes volumes de dados reais e sintéticos.
- Ampliação de dados: o Cosmos Transfer expande os conjuntos de dados ao multiplicar cenários reais e simulados, permitindo capturar variações de ambiente, iluminação e eventos raros.
- Avaliação e validação: o NVIDIA Cosmos Evaluator, construído sobre o Cosmos Reason, analisa automaticamente os dados gerados, garantindo precisão física antes do treinamento dos modelos.
A NVIDIA já utiliza essa arquitetura para treinar o NVIDIA Alpamayo, uma nova geração de modelos abertos que combinam visão, linguagem e ação voltados para condução autônoma de longo prazo.
Parcerias com Microsoft Azure e Nebius
Para viabilizar o processamento em larga escala, a NVIDIA está trabalhando com provedores de nuvem como Microsoft Azure e Nebius. No caso do Azure, o blueprint está sendo integrado a uma cadeia de ferramentas de IA física que inclui serviços como:
- Azure IoT Operations
- Microsoft Fabric
- Real-Time Intelligence
- Microsoft Foundry
- GitHub Copilot
A ideia é oferecer um ambiente corporativo completo para criação, treinamento e validação de sistemas de IA física.
Já a Nebius integrou o framework NVIDIA OSMO à sua infraestrutura de nuvem, permitindo que desenvolvedores criem pipelines de dados prontos para produção. A infraestrutura utiliza GPUs NVIDIA RTX PRO 6000 Blackwell Server Edition, além de armazenamento de alta velocidade e serviços gerenciados de inferência.
Orquestração de IA com agentes automatizados
Outro componente central do projeto é o NVIDIA OSMO, um framework open source responsável por orquestrar fluxos de trabalho de IA em diferentes ambientes de computação.
O sistema também passa a integrar agentes de programação como Claude Code, OpenAI Codex e Cursor. Esses agentes podem gerenciar automaticamente recursos computacionais, resolver gargalos e acelerar o treinamento de modelos. A proposta é reduzir a complexidade operacional envolvida na criação de pipelines de dados massivos para robótica e sistemas autônomos.
Empresas já utilizam o blueprint
Diversas empresas já começaram a testar o projeto da NVIDIA em aplicações reais. Entre elas estão FieldAI, Hexagon Robotics, Linker Vision, Milestone Systems, Skild AI, RoboForce, Teradyne Robotics e Uber.
A Skild AI, por exemplo, utiliza a arquitetura para treinar modelos de robôs de uso geral, enquanto a Uber aplica a tecnologia no desenvolvimento de veículos autônomos.
Segundo Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina, a iniciativa marca um novo estágio na evolução da IA física.
Disponibilidade
A NVIDIA confirmou que o Physical AI Data Factory Blueprint será disponibilizado publicamente no GitHub em abril de 2026, permitindo que desenvolvedores e empresas adotem a arquitetura em projetos de robótica, visão computacional e mobilidade autônoma.