Home Tecnologia Le chat vocali basate sull’intelligenza artificiale risultano ancora scomode perché gli assistenti...

Le chat vocali basate sull’intelligenza artificiale risultano ancora scomode perché gli assistenti non sanno quando parlare

10
0

Laboratorio di macchine per pensare dice sta costruendo un’intelligenza artificiale full duplex, il che significa che un sistema di intelligenza artificiale può assorbire ciò che qualcuno cube mentre genera una risposta. In parole povere, è più vicino a una telefonata che a un walkie-talkie.

La startup, fondata lo scorso anno dall’ex CTO di OpenAI Mira Murati, ha annunciato modelli di interazione, a partire da TML-Interplay-Small. Cube che il sistema può rispondere in 0,40 secondi, un ritmo che lo avvicina al normale andamento avanti e indietro di un essere umano.

C’è un problema per chiunque speri di provarlo oggi. Questa rimane un’anteprima della ricerca, con un accesso limitato previsto nei prossimi mesi e un rilascio più ampio previsto entro la nice dell’anno.

Un tipo più veloce di scambio AI

L’thought centrale è facile da capire e il cambiamento è significativo. Invece di aspettare che qualcuno finisca di parlare prima di lavorare su una risposta, il modello elabora il discorso in arrivo mentre prepara la risposta.

Questo ritardo è importante perché le pause fanno sembrare artificiali gli assistenti AI. Considering Machines Lab considera il tempo di risposta di 0,40 secondi di TML-Interplay-Small il più vicino possibile alla velocità di conversazione naturale, il che rappresenterebbe un cambiamento notevole per gli strumenti vocali.

Afferma inoltre che il ritmo è più veloce rispetto ai modelli comparabili di OpenAI e Google. Il benchmark dà peso all’annuncio, ma gli utenti esterni devono ancora verificare se l’esperienza funziona così bene come suggerisce il numero.

Quando la velocità diventa comportamento

Un assistente che risponde mentre sta ancora raccogliendo informazioni cambia ciò che gli utenti si aspettano da una chat vocale. La conversazione può procedere più velocemente, ma il sistema deve anche gestire i tempi con molta più attenzione.

Questo compromesso è importante quando qualcuno desidera un chiarimento rapido anziché una risposta lunga. Risposte più rapide non saranno di grande aiuto se l’assistente interviene troppo presto, fraintende l’oratore o interrompe il flusso che dovrebbe migliorare.

Per ora, l’architettura è la novità. Il vero check del prodotto è se il modello di interazione può far sembrare automatico un tempismo migliore.

Cosa guardare prima del lancio

La tempistica del rilascio è il dettaglio chiave ora. Considering Machines Lab afferma che nei prossimi mesi arriverà un’anteprima limitata della ricerca, seguita da un accesso più ampio entro la nice dell’anno.

Disponibilità, prezzi, piattaforme supportate e prestazioni al di fuori dei check controllati non sono ancora chiari. Quei pezzi mancanti contano perché un modello più veloce aiuta solo se le persone possono usarlo negli strumenti vocali di tutti i giorni.

Per chiunque utilizzi gli assistenti vocali AI, la mossa pratica è guardare da vicino l’anteprima. L’intelligenza artificiale full duplex è promettente, ma i check pratici dovrebbero mostrare se risposte più rapide rendono effettivamente più facili le conversazioni quotidiane dell’intelligenza artificiale.

fonte

LEAVE A REPLY

Please enter your comment!
Please enter your name here