Mercoledì scorso, a poche settimane dalla fine dell’anno, Google ha lanciato quello che considera il suo modello di intelligenza artificiale più grande e capace, Gemini, e ha presentato un video dimostrativo ai media e al pubblico.
Il video, della durata di sei minuti, include conversazioni parlate tra l’utente e un chatbot alimentato da Gemini e mostra anche la capacità di Gemini di riconoscere immagini visive e oggetti fisici e di riconoscerne la differenza. Alcune capacità sono impressionanti, come la capacità di Gemini di descrivere ad alta voce i disegni di una papera e di descrivere un disegno di una papera rispetto a una papera di gomma, tra gli altri esempi.
La descrizione dell’azienda su YouTube include una breve riga che dice: “Ai fini di questa dimostrazione, la latenza è stata ridotta e le uscite di Gemini sono state abbreviate per brevità“. Tuttavia, il video stesso non riporta questa dichiarazione di non responsabilità.
Dopo il lancio, l’azienda ha confermato a Bloomberg che la dimostrazione non è stata condotta in tempo reale, ma ha utilizzato immagini fisse e messaggi di testo a cui Gemini rispondeva, come già sottolineato da The Information. L’autore ha osservato che si tratta di un’idea “molto diversa” da quella che Google sembra suggerire: “che una persona possa avere una conversazione vocale fluida con Gemini mentre questo osserva e risponde in tempo reale al mondo che lo circonda”.
Dopo molteplici richieste di commento, venerdì l’azienda ha dichiarato alla CNBC che “il video è una rappresentazione illustrativa delle possibilità di interazione con Gemini, basata su richieste multimodali reali e sui risultati dei test. Non vediamo l’ora di vedere cosa creeranno le persone quando l’accesso a Gemini Pro sarà aperto il 13 dicembre”.
Sebbene le dimostrazioni siano spesso modificate, i risultati successivi di Gemini fanno pensare a un déjà vu per il gigante della ricerca.All’inizio dell’anno Google ha dovuto affrontare le critiche del pubblico e di Wall Street per quella che i suoi stessi dipendenti hanno definito una dimostrazione “affrettata e pasticciata” dei suoi chatbot di intelligenza artificiale, avvenuta nella stessa settimana in cui Microsoft aveva in programma di presentare il suo Bing Pro. All’inizio del mese, The Information ha riferito che Google ha abbandonato i piani per una serie di eventi di persona per il lancio di Gemini, optando per un lancio virtuale.