menu
close

Google wprowadza Imagen 4 z rewolucyjnym generowaniem tekstu na obrazach

Google zaprezentował Imagen 4, swój najnowocześniejszy model AI do generowania obrazów na podstawie tekstu, udostępniając go deweloperom poprzez Gemini API oraz Google AI Studio od 15 lipca 2025 roku. Najnowsza wersja przynosi znaczące ulepszenia jakości obrazów, szczególnie w zakresie odwzorowania tekstu, oraz wprowadza dwa warianty modelu, odpowiadające różnym potrzebom twórczym. Technologia pozwala generować bardzo szczegółowe wizualizacje na podstawie opisów tekstowych, znajdując zastosowanie w projektowaniu, marketingu, rozrywce i innych dziedzinach kreatywnych.
Google wprowadza Imagen 4 z rewolucyjnym generowaniem tekstu na obrazach

Google DeepMind oficjalnie zaprezentował Imagen 4 – najbardziej zaawansowany dotąd model generowania obrazów na podstawie tekstu, oferując deweloperom potężne narzędzia do tworzenia wizualizacji generowanych przez AI.

Premiera, która miała miejsce 15 lipca poprzez Gemini API oraz Google AI Studio, wprowadza dwa odrębne modele z rodziny Imagen 4. Standardowy model Imagen 4, wyceniony na 0,04 USD za wygenerowany obraz, stanowi flagową propozycję Google do szerokiego zakresu zadań związanych z generowaniem obrazów. Dla bardziej wymagających zastosowań, wymagających precyzyjnego odwzorowania poleceń tekstowych, przewidziano model Imagen 4 Ultra, oferujący rozszerzone możliwości w cenie 0,06 USD za obraz.

Imagen 4 to znaczący krok naprzód względem poprzednika – Google podkreśla „niesamowitą klarowność detali”, takich jak misternie odwzorowane tkaniny, krople wody czy futro zwierząt. Model świetnie radzi sobie zarówno ze stylami fotorealistycznymi, jak i abstrakcyjnymi, obsługując różne proporcje obrazu oraz rozdzielczości do 2K.

Szczególnie istotną nowością jest znacznie ulepszone generowanie tekstu na obrazach – problem, z którym dotąd zmagały się modele AI. To udoskonalenie czyni technologię niezwykle przydatną przy tworzeniu materiałów marketingowych, plakatów, zaproszeń, komiksów i innych wizualizacji łączących obraz z tekstem.

„Imagen 4 to ogromny krok naprzód pod względem jakości” – podkreśla Josh Woodward, szef zespołu Google Labs. „Poświęciliśmy wiele uwagi i napraw temu, jak model generuje tekst i typografię, dzięki czemu świetnie sprawdza się przy tworzeniu slajdów, zaproszeń czy wszelkich materiałów, gdzie trzeba połączyć obraz z tekstem.”

Integracja technologii z ekosystemem Google, w tym aplikacjami Workspace, pozwala zwiększyć produktywność w różnorodnych kreatywnych i profesjonalnych procesach. Google zapowiada wprowadzenie kolejnych progów rozliczeniowych w najbliższych tygodniach, a także możliwość uzyskania wyższych limitów na żądanie. Firma planuje również udostępnić szybszy wariant Imagen 4, który może działać nawet dziesięciokrotnie szybciej niż Imagen 3.

Source:

Latest News