L’intelligenza artificiale di Google è stata finalmente presentata. Si chiama Gemini, è multimodale e disponibile in tre versioni. Tra qualche giorno potremo averne un piccolo assaggio mentre per la versione più potente dovremo aspettare il 2024. Il lancio di Gemini testimonia l’impegno per rendere l’intelligenza artificiale sempre più efficiente nonostante le remore espresse da autorevoli esponenti del mondo tech e la necessità di leggi che la regolino.
Intelligenza artificiale di Google: come funziona Gemini
Le due caratteristiche principali di Gemini sono la multimodalità e la flessibilità. Gemini è multimodale perché riesce a operare a partire da diversi tipi di input: testo, codice, audio, video e immagini. La flessibilità si riferisce, invece, alla sua capacità di adattarsi a diversi dispositivi che siano data center o smartphone.
Il modello di intelligenza artificiale elaborato da Google ha tre versioni: Ultra, la versione più grande che può eseguire compiti molto complessi, Pro, che entrerà a far parte di Bard, Nano, la versione più efficiente operativa sugli smartphone. I primi ad averla saranno gli smartphone della famiglia Pixel.
Gemini, dicevamo, può riconoscere testo, immagini, audio anche contemporaneamente e può rispondere a domande molto complesse su argomenti altrettanto complessi. Si è dimostrato particolarmente bravo a spiegare temi complessi di matematica e fisica. Infine, questo modello di intelligenza artificiale apprende in automatico “per rinforzo”. E’ alimentata, cioè, da un sistema che gli insegna come comportarsi nelle diverse situazioni attraverso premi e punizioni.
La differenza tra Gemini e GPT
Quali sono le differenze tra Gemini e GPT? Prima di tutto, la versione Ultra di Gemini, assicurano i suoi ideatori, è più potente di Gpt-4. Inoltre, è in grado di rispondere su 57 discipline come matematica, fisica, diritto, storia, etica e medicina. Non solo risponde alle domande sintetizzando il testo e traducendo, è anche in grado di risolvere i problemi. Ciò che non è in grado di fare è esprimere ipotesi ragionevoli su situazioni osservate.
Gemini ha dato risultati eccezionali su diversi benchmark. Ha superato, cioè, diversi test specifici che ne hanno valutato l’attività. Le attività di codifica sono state testate su HumanEval, mentre Natural2Code ha testato la sua capacità di generare informazioni dall’autore e non partendo dal web. Gemini è in grado di fungere da motore per sistemi di codifica avanzati.
Una prima versione di Gemini sarà disponibile già a breve mentre la versione più potente sarà rilasciata nel 2024.
L’intelligenza artificiale nel 2024
Il tema dell’intelligenza artificiale ha interessato tutto il 2023. Dalla diffusione potremmo dire capillare di GPT alle remore espresse da grandi imprenditori del settore tech. Ha sollevato problemi di diritto d’autore e di sicurezza e animato agitazioni da parte di lavoratori e professionisti. Ricordiamo tutti gli scioperi degli attori di Hollywood e qualcuno ricorderà che GPT ha dovuto elevare i propri standard di sicurezza per essere nuovamente operativo in Europa dopo una breve pausa.
Cosa vedremo nel 2024? Difficile a dirsi, quello che sappiamo è che la ricerca in questo campo continuerà a progredire e che l’Unione europea si sta muovendo per approvare la prima legge al mondo per regolamentare l’intelligenza artificiale.
In copertina foto di Gerd Altmann da Pixabay