Google po cichu, lecz znacząco ulepszył swój model Imagen 4 Ultra, czyniąc go jednym z czołowych systemów generowania obrazów przez sztuczną inteligencję na świecie. Ulepszony model zajmuje obecnie trzecie miejsce na liście Image Arena prowadzonej przez Artificial Analysis, stając się bezpośrednim konkurentem liderów branży: GPT-4o od OpenAI oraz Seedream 3.0 od ByteDance.
Po raz pierwszy zaprezentowany podczas Google I/O 2025 w maju, Imagen 4 Ultra stanowi istotny krok naprzód względem poprzednika. Model wyróżnia się doskonałym odwzorowaniem skomplikowanych detali, takich jak faktura tkanin, krople wody czy sierść zwierząt. Użytkownicy zauważają znaczące postępy zarówno w stylach fotorealistycznych, jak i abstrakcyjnych, a generowane obrazy mogą osiągać rozdzielczość do 2K.
Jedną z najbardziej zauważalnych innowacji Imagen 4 Ultra jest poprawa w generowaniu tekstu na obrazach – odwieczne wyzwanie dla AI. Model wykazuje znacznie lepsze możliwości typograficzne, co czyni go szczególnie przydatnym do tworzenia kartek okolicznościowych, plakatów oraz innych projektów łączących grafikę z tekstem.
Google udostępnił Imagen 4 Ultra przez różne kanały, w tym aplikację Gemini, Google AI Studio oraz Vertex AI dla klientów biznesowych. Przy cenie 0,06 USD za wygenerowany obraz model oferuje konkurencyjną strukturę kosztów w porównaniu do GPT-4o (ok. 0,17 USD za obraz), a czas generowania wynosi ok. 9,5 sekundy wobec 53 sekund w GPT-4o.
Aktualizacja podkreśla determinację Google w rywalizacji na najwyższym poziomie w obszarze generatywnej AI. Zdaniem analityków branżowych, dalsze udoskonalanie rodziny Imagen przez Google DeepMind świadczy o zaangażowaniu firmy w przesuwanie granic możliwości generowania treści wizualnych przez AI.
Patrząc w przyszłość, Google zapowiada, że kolejne aktualizacje Imagen 4 Ultra będą skupiać się na uwzględnianiu opinii użytkowników oraz dalszym skracaniu czasu generowania. Firma pracuje także nad wersją „Fast” Imagen 4, która ma być nawet 10 razy szybsza od Imagen 3, co dodatkowo zwiększy jej przydatność w zastosowaniach czasu rzeczywistego.