Disponibile in tre versioni, è il primo modello a superare gli esseri umani nella comprensione del linguaggio multitasking su larga scala, che utilizza una combinazione di 57 materie come matematica, fisica, storia, diritto, medicina ed etica
Google ha presentato Gemini, il suo modello di intelligenza artificiale (IA) più avanzato e versatile finora. Questo strumento verrà integrato sia in Bard, la piattaforma di Google, sia negli ultimi smartphone Pixel 8 Pro. Il CEO di Google, Sundar Pichai, ha evidenziato le prestazioni d'avanguardia di Gemini su numerosi benchmark leader nel settore. Gemini 1.0 sarà disponibile in diverse versioni: Ultra, Pro e Nano. "Questi sono i primi modelli dell'era Gemini e realizzano la visione che avevamo quando abbiamo fondato Google DeepMind all'inizio di quest'anno. Questa nuova era di modelli rappresenta uno degli sforzi scientifici e ingegneristici più grandi intrapresi dalla nostra azienda," ha affermato Pichai.
Frutto del lavoro collaborativo di team di Google, incluso il Google Research, Gemini è stato progettato per essere capace di "generalizzare e comprendere, operare e combinare senza soluzione di continuità diversi tipi di informazioni, inclusi testo, codice, audio, immagini e video". Durante una dimostrazione, Google ha mostrato come Gemini possa vedere con occhio umano, comprendere, valutare in tempo reale e suggerire il prossimo passo. Gemini Ultra sarà il modello più grande e capace per compiti altamente complessi, mentre Gemini Pro eccellerà nell'affrontare una vasta gamma di attività, e Gemini Nano gestirà compiti direttamente sui dispositivi. Da oggi, Gemini Nano sarà disponibile nel Pixel 8 Pro, alimentando nuove funzionalità come il Riepilogo nell'app Recorder e la Risposta Intelligente tramite Gboard, iniziando con WhatsApp. Gemini verrà implementato in ulteriori prodotti e servizi Google, tra cui Search, Ads, Chrome e Duet AI.
Dal 13 dicembre, sviluppatori e clienti aziendali potranno accedere a Gemini Pro tramite l'API Gemini in Google AI Studio o Google Cloud Vertex AI. Gli sviluppatori Android potranno anche utilizzare Gemini Nano tramite AICore, una nuova funzionalità di sistema disponibile in Android 14, a partire dai dispositivi Pixel 8 Pro. Gemini Ultra sarà disponibile a una cerchia ristretta di clienti, sviluppatori, partner e esperti di sicurezza per esperimenti e feedback preliminari, prima di essere distribuito a sviluppatori e clienti aziendali all'inizio del prossimo anno.
Nel frattempo, Bard riceverà una "versione specificamente ottimizzata di Gemini Pro in inglese per ragionamenti, pianificazioni, comprensioni avanzate e altro". All'inizio del prossimo anno, Google introdurrà Bard Advanced, che offrirà agli utenti un primo accesso ai suoi modelli e capacità più avanzati, a partire da Gemini Ultra. Google afferma che le prestazioni di Gemini Ultra superano i risultati attuali di stato dell'arte in 30 dei 32 benchmark comunemente utilizzati nella ricerca e sviluppo dei modelli di linguaggio. Con un punteggio del 90,0%, Gemini Ultra è il primo modello a superare gli esperti umani nella comprensione del linguaggio multitasking su larga scala, che utilizza una combinazione di 57 materie come matematica, fisica, storia, diritto, medicina ed etica per testare sia la conoscenza del mondo che le capacità di risoluzione dei problemi. Inoltre, l'azienda ha dichiarato che Gemini può "comprendere, spiegare e generare codice di alta qualità nei linguaggi di programmazione più diffusi al mondo, come Python, Java, C++ e Go".