Home Tecnologia Google scuote il suo group di agenti del browser nel mezzo della...

Google scuote il suo group di agenti del browser nel mezzo della mania di OpenClaw

12
0

Google trema il group dietro Undertaking Mariner, il suo agente AI che può navigare nel browser Chrome e completare attività per conto di un utente, ha appreso WIRED. Negli ultimi mesi, secondo due persone a conoscenza della questione, alcuni membri dello workers di Google Labs che hanno lavorato al prototipo di ricerca sono passati a progetti con priorità più elevata.

Un portavoce di Google ha confermato i cambiamenti, ma ha detto che le capacità di utilizzo del laptop sviluppate nell’ambito del Undertaking Mariner verranno incorporate nella strategia degli agenti dell’azienda in futuro. Google ha già integrato alcune di queste funzionalità in altri prodotti agente, incluso quello lanciato di recente Agente dei Gemelliha aggiunto il portavoce.

Il cambiamento arriva mentre Google e altri laboratori di intelligenza artificiale si affrettano a rispondere all’ascesa di agenti altamente capaci come OpenClaw. Sebbene oggi questi strumenti siano utilizzati principalmente dagli sviluppatori, la Silicon Valley ritiene che presto potrebbero diventare assistenti generici per persone e aziende. Il CEO di Nvidia Jensen Huang ha paragonato questo interessante strumento a un nuovo sistema operativo per laptop advert agenti. “Oggi ogni azienda nel mondo deve avere una strategia OpenClaw”, ha affermato alla conferenza degli sviluppatori dell’azienda all’inizio di questa settimana.

Il CEO di Google Sundar Pichai ha evidenziato Undertaking Mariner durante la conferenza I/O dello scorso anno. All’epoca, gli agenti browser sembravano la prossima grande scommessa del settore, con OpenAI e Perplexity che lanciavano agenti client che promettevano di automatizzare le attività on-line per gli utenti. Gli agenti potevano fare clic, scorrere e compilare moduli su una pagina Internet, proprio come un essere umano. Tuttavia, l’adozione di questi prodotti ha faticato a soddisfare le aspettative del settore.

L’agente browser Comet di Perplexity ha raggiunto solo 2,8 milioni di utenti attivi settimanali nel dicembre 2025. Nel frattempo, secondo quanto riferito, l’agente ChatGPT di OpenAI è sceso a meno di 1 milione di utenti attivi settimanali negli ultimi mesi. Rispetto alle centinaia di milioni di utenti che comunicano con ChatGPT su base settimanale, l’utilizzo dell’agente del browser equivale essenzialmente a un errore di arrotondamento.

Nuovi agenti in città

Lo slancio nel mondo dell’intelligenza artificiale si è spostato radicalmente nell’ultimo anno verso agenti come Claude Code e OpenClaw (il cui creatore è stato assunto da OpenAI). A differenza degli agenti di navigazione net, questi sistemi controllano i laptop tramite la riga di comando, che si è rivelata un modo più affidabile per completare le attività. Alcuni di questi prodotti includono l’uso del laptop come funzionalità, oltre advert altre capacità dell’agente. In confronto, gli agenti browser ora sembrano un po’ limitati come prodotto autonomo.

Kian Katanforoosh, amministratore delegato della piattaforma di miglioramento delle competenze AI Workera, che tiene conferenze sull’intelligenza artificiale a Stanford, afferma che parte del motivo per cui gli agenti che utilizzano il laptop non sono decollati è a causa dei loro enormi requisiti computazionali. La maggior parte di questi agenti funziona acquisendo una serie di screenshot di una pagina Internet, inserendoli in un modello di intelligenza artificiale e quindi intraprendendo azioni in base a ciò che vedono. L’elaborazione di tutte queste informazioni può essere lenta e talvolta inaffidabile.

“Ciò che Claude Code e OpenClaw hanno dimostrato è che in realtà è molto più efficiente lavorare con il terminale, perché il terminale è basato su testo e gli LLM sono basati su testo”, ha affermato Katanforoosh. “Probabilmente sono necessari da 10 a 100 volte meno passaggi per ottenere gli stessi risultati.”

Questo non vuol dire che gli agenti browser non stiano migliorando o che la ricerca sull’uso del laptop sia giunta a un vicolo cieco.

Il mese scorso, la startup Normal Intelligence ha rilasciato un file modello di utilizzo del computer addestrato sui video, piuttosto che sugli screenshot. La startup afferma di aver sviluppato un codificatore video in grado di comprimere i video nella finestra di contesto di un modello AI, che sostiene sia 50 volte più efficiente rispetto ai precedenti modelli di utilizzo del laptop. Per mostrare le capacità del suo modello di intelligenza artificiale, la startup lo ha collegato a un’auto, a un feed video dal vivo e alla tastiera di un laptop. Il modello è stato in grado di brevemente guidare autonomamente per San Francisco.

fonte

LEAVE A REPLY

Please enter your comment!
Please enter your name here