Sora promette di rivoluzionare il contenuto digitale con video di 60 secondi generati da semplici prompt testuali
OpenAI, azienda leader nell'ambito dell'intelligenza artificiale, ha introdotto un nuovo modello di IA chiamato Sora, che è in grado di creare video di 60 secondi "realistici" e "immaginativi" a partire da semplici e rapidi prompt (comandi) testuali.
La compagnia ha dichiarato che Sora è capace di generare video fino a 60 secondi di lunghezza a partire da istruzioni testuali, con la capacità di visualizzare scene con più personaggi, tipi specifici di movimento e sfondi dettagliati. Il modello comprende non solo ciò che l'utente ha chiesto nel prompt, "ma anche come queste cose esistono e coesistono nel mondo fisico," recita il post sul blog.
Sebbene i "modelli multi-modali" non siano una novità e modelli di testo-video esistano già, ciò che sembra distinguere Sora è la lunghezza e l'accuratezza che OpenAI afferma di avere raggiunto.
Del resto è possibile rendersene conto osservando gli incredibili video rilasciati dalla stessa OpenAI.
Al momento OpenAI preferisce tuttavia concentrarsi sulla sicurezza, Sora è infatti stato affidato per vari test ad un team di esperti al fine di esaminare attentamente varie aree tra cui la disinformazione, i contenuti d'odio, i pregiudizi e i deep fake anche con riferimento a quanto recentemente accaduto a Taylor Swift.
Sora sarà inizialmente reso disponibile a professori di cybersecurity, chiamati "red teamers", che possono valutare il prodotto per eventuali danni o rischi, allo stesso modo è stato concesso un pre accesso ad artisti visivi, designer e cineasti per raccogliere feedback e ulteriori suggerimenti.