NVIDIA Research ha sviluppato una tecnologia IA all’avanguardia destinata a trasformare il modo in cui vengono creati gli effetti visivi nei settori cinematografico e videoludico. DiffusionRenderer, presentato al CVPR 2025, rappresenta un cambiamento fondamentale nella grafica computerizzata, combinando due processi tradizionalmente separati—il rendering inverso e quello diretto—in un unico framework neurale.
Il sistema funziona tramite un approccio a due fasi alimentato da modelli di video diffusion. Prima, un neural inverse renderer analizza filmati RGB standard e stima in modo intelligente le proprietà intrinseche della scena, generando buffer di dati essenziali (G-buffer) che descrivono geometria (profondità, normali) e materiali (colore, rugosità, metallicità) a livello di pixel. Successivamente, un neural forward renderer genera immagini fotorealistiche a partire da questi G-buffer senza la necessità di simulare esplicitamente il trasporto della luce.
Ciò che rende DiffusionRenderer rivoluzionario è l’eliminazione della necessità di rappresentazioni 3D precise della scena e del costoso path tracing richiesto dal rendering fisicamente basato (PBR) tradizionale. "Il PBR classico si basa su geometrie 3D esplicite, proprietà dei materiali di alta qualità e condizioni di illuminazione spesso difficili da ottenere in scenari reali", spiega Sanja Fidler, VP of AI Research di NVIDIA.
Per i filmmaker indipendenti e i piccoli studi, questa tecnologia rappresenta una democratizzazione degli effetti visivi di alto livello. I creatori possono ora girare un semplice video RGB e utilizzare DiffusionRenderer per aggiungere elementi CGI che proiettano ombre e riflessi realistici—senza costosi sistemi di light stage, scansioni LiDAR o attrezzature specializzate. Il sistema può inoltre rilluminare dinamicamente intere scene, cambiare materiali e inserire oggetti virtuali nel girato reale in modo fluido.
Dalla sua prima versione, NVIDIA ha integrato DiffusionRenderer con i foundation model Cosmos Predict-1, ottenendo risultati di qualità significativamente superiore. La tecnologia è disponibile sotto licenza Apache 2.0 e NVIDIA Open Model License, con codice e pesi dei modelli accessibili su GitHub. Con la crescita delle capacità in termini di risoluzione e gamma dinamica, DiffusionRenderer si prepara a diventare uno strumento essenziale per i creatori di ogni livello di budget, cambiando radicalmente l’approccio allo storytelling visivo nel cinema, nella pubblicità e nello sviluppo di videogiochi.