Quanti P ci sono in Google? Secondo Google ce ne sono due.
C’è anche “esattamente 1 ‘r’ nella parola ‘cacca’”, cube la panoramica AI di Google, così come due ‘d’ nella parola giornalismo, ma scritta: giornalismo. Google almeno ha identificato che c’è una P nel cognome del presidente degli Stati Uniti, ma l’ha scritta come trpum.
Non c’period bisogno di essere un profeta per prevedere che la revisione della ricerca avanzata dall’intelligenza artificiale di Google sarebbe andata male. Lo abbiamo già fatto prima. La prima volta che Google ha aggiunto le panoramiche AI alla ricerca, la funzione ha finito per citare publish satirici di The Onion e Reddit, consigliando alle persone di mangiare sassi e mettere la colla sulla pizza.
Questa volta, mentre Google raddoppia il suo impegno per rendere l’intelligenza artificiale generativa il fulcro del suo prodotto di punta, lanciato 29 anni fa, non sorprende vederlo inciampare.
“Contare a parole è stata una sfida nota per i LLM e stiamo lavorando per risolvere questo particolare problema”, ha dichiarato Google a TechCrunch in una dichiarazione inviata through electronic mail.
Questi errori di ortografia di base possono sembrare familiari. Gli LLM, il tipo di intelligenza artificiale che alimenta i chatbot e altri generatori di testo, non sono progettati per comprendere l’ortografia. Per anni è stato uno scherzo che ogni volta che un’azienda presenta un nuovo modello di intelligenza artificiale, dovresti chiederle quante “r” ci sono nella parola fragola. Questi modelli di intelligenza artificiale, che possono codificare un’app in pochi secondi o risolvere problemi che hanno lasciato perplessi i matematici per decenni, sono bravi quanto un bambino dell’asilo in ortografia.
Tuttavia, i problemi della panoramica dell’intelligenza artificiale di Google vanno oltre gli stupidi errori di ortografia. Google ha già risolto un problema della scorsa settimana in cui la ricerca della parola “disregard” produceva quella che sembrava una definizione della parola da parte di un dizionario, solo che la definizione veniva mostrata come “Capito. Fammi sapere ogni volta che hai un nuovo suggerimento o domanda!” Ma questi errori di ortografia sono rimasti divertenti perché sono difficili da eliminare.
Come i ricercatori hanno spiegato in precedenza quando abbiamo chiesto informazioni su questi enigmi di ortografia, l’intelligenza artificiale non percepisce le frasi come unità linguistiche composte da parole e lettere. Molti LLM sono basati su modelli di trasformatori, che scompongono il testo in token, che possono essere parole intere, sillabe o lettere, a seconda del modello. Invece di “leggere” come farebbe un essere umano, l’intelligenza artificiale converte il testo in rappresentazioni numeriche di se stesso, che vengono poi contestualizzate per aiutare l’intelligenza artificiale a fornire una risposta logica.
“I LLM si basano su questa architettura del trasformatore, che in particolare non legge effettivamente il testo. Ciò che accade quando si inserisce un immediate è che viene tradotto in una codifica”, ha detto a TechCrunch Matthew Guzdial, ricercatore di intelligenza artificiale e assistente professore presso l’Università di Alberta. “Quando vede la parola ‘il’, ha questa codifica di ciò che significa ‘il’, ma non conosce la ‘T’, la ‘H’, la ‘E’.”
L’architettura basata su token che alimenta i LLM come la panoramica dell’intelligenza artificiale di Google è intrinsecamente limitante e i ricercatori non sono stati ottimisti sulla possibilità di risolvere il problema di ortografia.
“È piuttosto difficile aggirare la questione di cosa dovrebbe essere esattamente una ‘parola’ per un modello linguistico, e anche se convincessimo gli esperti umani a concordare un vocabolario simbolico perfetto, i modelli probabilmente troverebbero comunque utile” suddividere ulteriormente le cose “, ha detto a TechCrunch Sheridan Feucht, uno studente di dottorato che studia l’interpretabilità di modelli linguistici di grandi dimensioni presso la Northeastern College. “La mia ipotesi è che non esista un tokenizzatore perfetto a causa di questo tipo di confusione.”
Questo non è necessariamente un problema urgente nella mente dei ricercatori, dal momento che l’utilità degli LLM non deriva dalla loro capacità di scrivere. Ma questi palesi fallimenti ci aiutano a ricordare che l’intelligenza artificiale non è perfetta, anche se a volte può sembrare un potere onnisciente al di là della nostra comprensione. Non possiamo fidarci ciecamente dei risultati dell’intelligenza artificiale senza ricontrollarne l’accuratezza.
Quando acquisti tramite i hyperlink presenti nei nostri articoli, potremmo guadagnare una piccola commissione. Ciò non pregiudica la nostra indipendenza editoriale.











