Con Stable Diffusion 3 scoppia la guerra delle immagini create dall'Intelligenza Artificiale

Stability AI è la startup di arte generativa basata sull’intelligenza artificiale, fondata nel 2022, che sta facendo tremare giganti del settore del calibro di OpenAI e Google. Come? Con il recentissimo lancio di Stable Diffusion 3 (SD3), un modello super avanzato e potente per la generazione di immagini realistiche e di alta qualità, ottenuto dopo anni di ricerca e sviluppo.

Stable Diffusion 3, cos’è

Sebbene il modello non sia ancora ampiamente disponibile, nei giorni scorsi la società ha aperto la lista d’attesa per un’anteprima anticipata (ci si può iscrivere qui). Una fase, che, come già avvenuto per i modelli precedenti, sarà fondamentale per raccogliere approfondimenti e suggerimenti in modo da migliorare le prestazioni e la sicurezza del sistema prima di un rilascio aperto.

Ora arrivato al suo terzo livello, Stable Diffusion permette, a partire da indicazioni testuali, di creare opere d’arte uniche e originali usando algoritmi di intelligenza artificiale.
Come spiega la stessa Stability AI, si tratta di un modello di conversione da testo a immagine molto potente, che offre prestazioni notevolmente migliorate per quanto riguarda l’interpretazione dei suggerimenti, la qualità grafica e la capacità di scrittura senza errori di ortografia. Il risultato è un’immagine che non esiste nella realtà, ma che è frutto della creatività dell’intelligenza artificiale.

Stable Diffusion 3, come funziona

La principale differenza tra Stable Diffusion e i modelli che l’hanno preceduto, come spiega ancora la startup, è la possibilità per gli utenti di inserire all’interno delle immagini anche dei testi in maniera chiara e precisa, funzionalità che altrove non si trova oppure che risulta di qualità piuttosto scarsa. Spesso, infatti, gli strumenti di AI generativa producono immagini con aggiunta di scritte che però sono sgrammaticate e poco comprensibili.

E per quanto riguarda la tanto dibattuta questione etica legata all’Intelligenza Artificiale? “Crediamo in pratiche sicure e responsabili – dichiara Stability AI -. Ciò significa che abbiamo adottato e continuiamo ad adottare misure ragionevoli per prevenire l’uso improprio di Stable Diffusion 3 da parte di malintenzionati. La sicurezza inizia quando iniziamo ad addestrare il nostro modello e continua durante tutto il test, la valutazione e l’implementazione. In preparazione a questa anteprima, abbiamo introdotto numerose misure di salvaguardia e contiamo di continuare a farlo grazie al supporto di ricercatori ed esperti, nonché della nostra comunità. Il nostro impegno nel garantire che l’intelligenza artificiale generativa sia aperta, sicura e universalmente accessibile rimane costante”.

Immagini e AI, Google ferma Gemini AI

Cosa fa intanto la concorrenza? Innanzitutto, proprio a ridosso dell’annuncio di Stable Diffusion 3, Google ha messo in pausa Gemini AI, il suo modello di generazione di immagini tramite Intelligenza Artificiale. Il motivo? Le numerose critiche ricevute rispetto ai “pregiudizi contro i bianchi” da parte del sistema: numerosi utenti hanno infatti segnalato che le immagini scaturite dall’AI raffiguravano spesso persone con etnie e generi sbagliati dal punto di vista storico. Il colosso di Mountain View ha così deciso di sospendere la possibilità di creare illustrazioni di essere umani in attesa di risolvere il problema.

OpenAI, dopo ChatGPT, presenta Sora

Contemporaneamente l’altro big del settore, OpenAI, la stessa società di ChatGPT, ha lanciato Sora, nuovo modello di AI in grado di generare video con fedeltà sorprendente. Una piattaforma, ancora in fase di sviluppo e al momento non disponibile al pubblico, che promette di aprire nuove frontiere nella creazione di contenuti multimediali, combinando la potenza dell’IA con una comprensione avanzata del tempo e della fisica.

Insomma, per chi naviga nel mare magnum delle Intelligenze Artificiali ci sono sempre nuove mete all’orizzonte.