Penyelidikan NVIDIA telah membangunkan teknologi AI yang bakal merevolusikan cara kesan visual dihasilkan dalam industri filem dan permainan. DiffusionRenderer, yang dipersembahkan di CVPR 2025, menandakan perubahan asas dalam grafik komputer dengan menggabungkan dua proses yang sebelum ini terpisah—rendering songsang dan rendering hadapan—ke dalam satu rangka neural yang bersatu.
Sistem ini berfungsi melalui pendekatan dua peringkat yang dipacu oleh model difusi video. Pertama, neural inverse renderer menganalisis rakaman video RGB biasa dan secara pintar menganggarkan sifat intrinsik adegan, menghasilkan data buffer penting (G-buffer) yang menerangkan geometri (kedalaman, normal) dan bahan (warna, kekasaran, logam) pada peringkat piksel. Kemudian, neural forward renderer menjana imej fotorealistik daripada G-buffer ini tanpa memerlukan simulasi pengangkutan cahaya secara eksplisit.
Apa yang menjadikan DiffusionRenderer begitu revolusioner ialah ia menghapuskan keperluan untuk representasi adegan 3D yang tepat dan penjejakan laluan (path tracing) yang memerlukan pengiraan intensif seperti dalam rendering berasaskan fizikal (PBR) tradisional. "PBR klasik memerlukan geometri 3D eksplisit, sifat bahan berkualiti tinggi, dan keadaan pencahayaan yang selalunya sukar diperoleh dalam situasi dunia sebenar," jelas Sanja Fidler, Naib Presiden Penyelidikan AI di NVIDIA.
Bagi pembikin filem bebas dan studio kecil, teknologi ini membawa pendemokrasian kesan visual bertaraf tinggi. Pencipta kini boleh merakam video RGB tunggal dan menggunakan DiffusionRenderer untuk menambah elemen CGI yang menghasilkan bayang-bayang dan pantulan realistik—tanpa memerlukan sistem light stage yang mahal, imbasan LiDAR, atau peralatan khusus. Sistem ini juga boleh menyalakan semula seluruh adegan secara dinamik, menukar bahan, dan memasukkan objek maya ke dalam rakaman sebenar dengan lancar.
Sejak pembangunan awalnya, NVIDIA telah mengintegrasikan DiffusionRenderer dengan model asas Cosmos Predict-1 mereka, mencapai hasil berkualiti jauh lebih tinggi. Teknologi ini tersedia di bawah lesen Apache 2.0 dan NVIDIA Open Model License, dengan kod dan berat model boleh diakses di GitHub. Dengan keupayaan resolusi dan julat dinamik yang terus meningkat, DiffusionRenderer dijangka menjadi alat penting untuk pencipta pada semua peringkat bajet, sekaligus mengubah secara asas pendekatan penceritaan visual dalam filem, pengiklanan, dan pembangunan permainan.