L’intelligenza artificiale può superare il take a look at di Turing nelle chat dal vivo e l’ultimo risultato lascia i brividi. Nell’a Studio dell’UC San DiegoGPT-4.5 ha sovraperformato i partecipanti reali nel convincere i giudici che c’period una persona dall’altra parte.
La configurazione period più difficile da ignorare rispetto a un benchmark customary. I giudici hanno reagito agli scambi in tempo reale piuttosto che ai suggerimenti statici, quindi hanno effettuato una chiamata rapida basata esclusivamente sulla conversazione.
La parte inquietante è quanto l’abilità sembri familiare. La modella non aveva bisogno di un corpo, di una voce o di una biografia. Doveva solo sembrare qualcuno.
In che modo l’intelligenza artificiale ha superato il take a look at umano?
Lo studio ha utilizzato una versione a tre parti del take a look at. I giudici hanno chiacchierato sia con una persona che con un modello di intelligenza artificiale, quindi hanno scelto quale ritenevano fosse reale.
GPT-4.5 è stato identificato come umano il 73% delle volte quando gli è stato fornito un immediate relativo alla persona. Anche LLaMa-3.1-405B ha oltrepassato un limite sorprendente, venendo scelto come umano il 56% delle volte con un immediate di persona.
Questi numeri danno alla scoperta il suo morso. Il modello non si è limitato a evitare il rilevamento, ma ha fornito ai giudici sufficienti spunti sociali per interpretarlo come la persona nella chat.
Perché questo take a look at è ancora importante?
Il take a look at di Turing è un metodo vecchio di decenni per chiedersi se una macchina possa imitare la conversazione umana abbastanza bene da ingannare una persona. Nella versione classica, un valutatore chatta senza vedere i partecipanti, quindi cerca di distinguere l’essere umano dalla macchina.
È sempre stato più un simbolo culturale che una misura pulita. Tuttavia, rimane il take a look at che le persone riconoscono quando vogliono sapere se il software program può passare per uno di noi.

Ciò rende il nuovo risultato più nitido. Un chatbot non ha bisogno di coscienza, emozione o consapevolezza di sé per creare l’impressione che una persona reale stia rispondendo. Deve solo essere credibile in questo momento.
Il rischio si manifesta nei luoghi comuni. L’assistenza clienti, le app di appuntamenti, le piattaforme social, l’istruzione e i messaggi politici si basano tutti su giudizi rapidi su identità, intenti e autenticità.
Cosa dovremmo guardare dopo?
Lo studio si ferma ben prima di affermare che i chatbot capiscono le persone. La sua scoperta più pratica è che alcuni modelli ora possono rappresentare la personalità estremamente bene in scambi brevi.
Una divulgazione più chiara dovrebbe diventare il prossimo punto di pressione. Quando un bot riesce a integrarsi in una conversazione casuale, gli utenti hanno bisogno di segnali più forti che indichino che hanno a che fare con un software program, soprattutto nei luoghi in cui la persuasione o la vulnerabilità emotiva modellano lo scambio.
La battaglia successiva riguarda l’etichettatura nelle chat in cui le persone prendono decisioni rapide sulla fiducia.











