Ufficio

Google Imagen: l’AI che crea immagini a partire da testo

Che cos’è Imagen?

Imagen è il nuovo progetto di Google che sfrutta l’intelligenza artificiale per generare immagini a partire da un testo. Nonostante il progetto sia ancora in fase di test chiuso, Google ha diffuso alcune immagini per dimostrare la grande capacità del sistema Imagen. Infatti Imagen è in grado di interpretare e generare con efficacia immagini corrispondenti alla descrizione nel testo, anche quando ciò che viene descritto ha elementi di assurdità.

Nel caso di Imagen, la descrizione testuale può essere anche la più bizzarra, come per esempio “un maestoso dipinto a olio raffigurante una regina dei procioni che indossa una veste reale francese rossa” (figura 1) oppure “un dragonfruit che indossa una cintura di karate nella neve” (Figura 2).

Anche davanti alla più bizzarra richiesta Imagen riesce a interpretare  la descrizione restituendo con ottimi risultati ciò che è stato richiesto.

 

Come funziona?

Come spiegato dal Brain team di Google Image è un sistema basato sul modello “text-to-image”. Un sistema text-to-picture è un sistema che converte automaticamente un testo in linguaggio naturale in immagini che ne rappresentano il significato.

Questi modelli si poggiandosi su set di coppie di testi-immagini da combinare. L’AI analizza il testo della descrizione, comprende quanto scritto e pesca da un ampio database l’immagine corrispondente ad ogni elemento del testo e unisce le immagini in un collage grazie al fotoritocco.

 

Le problematiche

Purtroppo Imagen non è ancora disponibile al pubblico. Questo perché Google non lo ritiene ancora pronto per l’uso generale per una serie di motivi. Di fatti, I modelli text-to-image sono in genere addestrati su grandi insiemi di dati scaricati direttamente dl web, il che può causare una serie di problemi. Sebbene negli ultimi anni questo approccio abbia consentito rapidi progressi algoritmici, i dataset di questa natura riflettono spesso stereotipi sociali, opinioni dispregiative o comunque dannose con gruppi identitari emarginati.

È comprensibile che Google, prima di diffondere questo tool al pubblico, voglia assicurarsi che il sistema sia privo di difetti. Infatti Google potrebbe incorrere in controversie. Quel che è certo è che, una volta lanciato ufficialmente, Imagen diventerà un fenomeno dei social media per la sua straordinaria capacità di generare immagini, anche le più fantasiose e creative, senza dimenticare le applicazioni commerciali o i montaggi con foto personali.

Tuttavia, Imagen è attualmente disponibile in forma limitata, consentendo agli utenti di scegliere tra una serie di frasi che possono essere combinate. Sul sito web di Imagen è possibile vedere una serie di esempi di ciò che l’intelligenza artificiale è stata in grado di realizzare.

Attualmente, però, è possibile provare Imagen in forma limitata, scegliendo da un insieme di frasi che possono essere combinate insieme. Sul sito di Imagen è inoltre possibile visualizzare vari esempi di quanto l’IA sia stata in grado di produrre.