Ultima modifica di Nathan- 54 anni fa

Gemini, il motore ultra-Woke di Google

La scala di GiacobbeGemini, il motore ultra-Woke di Google

La scala di Giacobbe - 27 febbraio 2024

La scorsa settimana, mentre OpenAI entusiasmava il mondo dell'intelligenza artificiale con Sora, il primo motore che permette di creare piccoli video realistici a partire da una semplice descrizione testuale, Alphabet (la società madre di Google) ha lanciato la nuova versione del suo agente conversazionale, la risposta dell'azienda globale a ChatGPT di OpenAI, a sua volta di proprietà di Microsoft. Il minimo che possiamo dire è che non siamo rimasti delusi.

   

Come al solito per lanciare correttamente il suo prodotto, Google ha cambiato leggermente il nome da Bard a Gemini (come era passato da Google Apps a GSuite poi Workspace, o da Google Local a Places a MyBusiness a Business Profile, o da Google Hangouts a Chat, ecc. ) conferendogli nuove funzionalità.

Bisogna riconoscere che il motore di intelligenza artificiale di Google è potente.

Le prossime settimane ci permetteranno senza dubbio di esplorare nel dettaglio cosa ha sotto il cofano, ma sappiamo già, ad esempio, che Gemini ora ha un pop-up da un milione di token. Questa finestra pop-up è ciò che consente all'agente di ricordare gli scambi da una domanda a quella successiva. In confronto, ChatGPT 3.5 (la versione gratuita) ha una finestra di circa 16.000 token e la versione 4 ne consente fino a 128.000 token e per dare un ordine di grandezza, quest'ultimo numero rappresenta all'incirca l'equivalente di un libro tascabile, dove Gemini può ricordare un’opera completa di 1.500 pagine…

Oppure un film di circa un'ora e mezza: Gemini permette all'utente di fornire immagini o video come input contestuale su cui basare le proprie risposte; per riassumere velocemente un video, questo potrebbe rivelarsi particolarmente interessante nel prossimo futuro.

Ma accanto a questi innegabili progressi tecnici e a una potenza davvero interessante, Gemini si è distinta soprattutto per la rapidissima individuazione di un problema piuttosto imbarazzante per l'azienda californiana di Mountain View: senza dubbio il desiderio di recuperare terreno in termini di produzione di immagini da un punto di vista testuale. descrizione – OpenAI consente infatti ai suoi clienti da diversi mesi di produrre immagini direttamente da ChatGPT – Gemini era dotato di questa possibilità ma durante l'uso divenne subito evidente che alcune richieste semplicemente non venivano accettate o che il divario tra richieste e risultati era così grande che, molto rapidamente, i social network hanno preso in mano la questione.

Nessun dubbio: quando ai Gemelli viene chiesto di produrre immagini con contenuto storico o che rappresentino determinati gruppi etnici, questi ultimi interpretano la richiesta in modo un po' troppo specifico.

Così, ottenere l'immagine di un cavaliere medievale o di un papa si traduce nella produzione di immagini sistematicamente in grossolano disaccordo con la realtà: l'intelligenza artificiale di Google si diverte a creare, con sospetto entusiasmo, cavalieri medievali di tutte le etnie possibili ma il cavaliere biondo con gli occhi azzurri è stranamente assente; le immagini dei papi prodotte si ispirano felicemente a donne, possibilmente indiane o nere; quanto agli imperatori romani, sono tutti sorprendentemente molto africani.

Il traguardo fu raggiunto quando, di fronte alla richiesta di rappresentare i soldati tedeschi nel 1943, Gemini ritenne opportuno produrre una serie di immagini decisamente inclusive che includessero orgogliosi rappresentanti neri della Wehrmacht... Chi ancora dubitava che la realtà storica potesse piegarsi così facilmente ai più vincoli moderni?

accedi all'articolo