Google DeepMind ha ufficialmente lanciato Imagen 4, il suo modello di generazione di immagini da testo più sofisticato, offrendo agli sviluppatori nuovi potenti strumenti per la creazione di visual generati dall’IA.
Il rilascio, disponibile dal 15 luglio sia tramite la Gemini API che Google AI Studio, introduce due modelli distinti all’interno della famiglia Imagen 4. Il modello standard, Imagen 4, proposto al prezzo di 0,04 dollari per immagine generata, rappresenta l’offerta di punta di Google per una vasta gamma di attività di generazione di immagini. Per applicazioni più esigenti che richiedono una fedeltà superiore alle istruzioni testuali, Imagen 4 Ultra offre capacità potenziate al costo di 0,06 dollari per immagine.
Imagen 4 segna un progresso significativo rispetto al suo predecessore, con Google che ne sottolinea la “straordinaria chiarezza nei dettagli più fini”, come tessuti intricati, gocce d’acqua e pelliccia di animali. Il modello eccelle sia negli stili fotorealistici che astratti, supportando vari formati e risoluzioni fino a 2K.
Forse l’aspetto più rilevante è che Imagen 4 affronta una delle sfide più persistenti nella generazione di immagini tramite IA: la resa del testo, ora notevolmente migliorata. Questo potenziamento rende la tecnologia particolarmente preziosa per la creazione di materiali di marketing, poster, inviti, fumetti e altri visual che combinano immagini e testo.
“Imagen 4 rappresenta un enorme passo avanti in termini di qualità”, ha dichiarato Josh Woodward, responsabile del gruppo Labs di Google. “Abbiamo dedicato molta attenzione e apportato numerose correzioni al modo in cui genera testo e tipografia, quindi è perfetto per creare slide o inviti, o qualsiasi altra cosa in cui sia necessario fondere immagini e testo.”
L’integrazione della tecnologia nell’ecosistema Google, comprese le applicazioni Workspace, la posiziona per aumentare la produttività in diversi flussi di lavoro creativi e professionali. Google ha inoltre indicato che nelle prossime settimane saranno introdotti ulteriori livelli di tariffazione, con limiti di utilizzo più elevati disponibili su richiesta. L’azienda prevede anche di rilasciare una variante più veloce di Imagen 4, in grado di operare fino a dieci volte più rapidamente rispetto a Imagen 3.