Home Tecnologia Web viene ricostruito per le macchine

Web viene ricostruito per le macchine

8
0

L’infrastruttura cloud è stata a lungo progettata attorno agli esseri umani che cercano, fanno clic, scorrono e trasmettono in streaming in modo costante e prevedibile. Gli agenti IA si comportano diversamente. Possono scatenare un’ondata di attività, attivando più agenti secondari che interrogano centinaia di database, cercano documenti e chiamano API in pochi secondi per poi scomparire con la stessa rapidità con cui sono arrivati.

Con questa premessa, Amazon sta riprogettando una parte fondamentale della sua infrastruttura cloud. Giovedì, AWS ha lanciato la sua prossima generazione di OpenSearch Serverlessun database vettoriale e di ricerca completamente gestito, essenzialmente un sistema per archiviare e recuperare informazioni su larga scala, progettato specificamente per i carichi di lavoro degli agenti. AWS afferma che il nuovo sistema può immediatamente espandersi quando gli agenti attivano attività e ridursi a zero quando inattivo.

Il lancio riflette una consapevolezza crescente nel settore tecnologico: l’infrastruttura originariamente progettata per un’Web guidata dagli esseri umani non funziona altrettanto bene in un mondo sempre più popolato da agenti.

Sebbene gli agenti IA rappresentino ancora una porzione relativamente piccola dell’attività Web, il traffico generato dalle macchine è già significativo ed è destinato a crescere. Cloudflare afferma che i bot hanno rappresentato il 31% del traffico HTTP complessivo negli ultimi sei mesi. I crawler AI, i motori di ricerca e gli assistenti costituivano circa un quarto di tutte le richieste di bot durante quel periodo.

“Il traffico non umano supererà il traffico umano nella prima metà del 2027”, ha affermato Li Yi Ohlsensenior product supervisor di Cloudflare, a TechCrunch.

Alla conferenza degli sviluppatori I/O di Google della scorsa settimana, la società ha affermato che gli utenti saranno in grado di iniziare a delegare attività ai sistemi di intelligenza artificiale, come effettuare ricerche sugli acquisti, prenotare viaggi, navigare sul Net e interagire con le app. Ma la responsabilità non si ferma agli agenti IA focalizzati sul consumatore. Le aziende implementano sempre più agenti internamente e per i propri clienti, creando dietro le quinte nuovi tipi di traffico generato dalle macchine.

Di conseguenza, i fornitori di servizi cloud e le società di infrastrutture hanno dovuto fare i conti con come adattare i sistemi costruiti per gli esseri umani a un mondo di agenti che recuperano costantemente e autonomamente informazioni, invocano strumenti e generano traffico da macchina a macchina.

È qui che entra in gioco il nuovo OpenSearch Serverless di AWS.

“I tempi sono semplici. Gli agenti stanno passando dalla sperimentazione alla produzione e creano modelli di traffico per i quali l’infrastruttura precedente semplicemente non period stata progettata”, ha dichiarato a TechCrunch Tia White, direttore generale di Amazon OpenSearch Service. “Hanno picchi senza preavviso, restano inattivi senza preavviso e le aziende hanno bisogno di una ricerca che tenga il passo senza pagare per elaborazione vuota o inattiva.”

Il cambiamento tecnico chiave di questa nuova generazione è che disaccoppia l’elaborazione dallo storage, consentendo all’elaborazione di aumentare in pochi secondi per soddisfare i picchi di traffico degli agenti e di ridursi a zero, in modo che i clienti paghino $ 0 quando gli agenti sono inattivi.

“In precedenza, anche nella nostra precedente versione Serverless, dovevi avere almeno un’istanza operativa e in esecuzione perché storage ed elaborazione erano accoppiati”, ha affermato White. “Non potevi semplicemente girare automaticamente [compute] alla velocità di cui avevi bisogno, in modo da avere sempre il calcolo inattivo riservato al tuo carico di lavoro, indipendentemente dal fatto che lo stessi utilizzando o meno.”

Immagina di pagare sempre per un parcheggio, anche quando non lo usi. Con la versione Serverless aggiornata di AWS, è più come pagare per un parcheggio a pagamento.

Al momento del lancio, OpenSearch Serverless si integrerà in modo nativo con piattaforme di sviluppo AI come Vercel e Kiro, in modo che gli sviluppatori possano implementare backend vettoriali e di ricerca pronti per la produzione per gli agenti senza gestire l’infrastruttura.

Il cambiamento sta emergendo in tutto il settore del cloud. Databricks e Snowflake si stanno riposizionando come sistemi di memoria e recupero AI per i dati aziendali. Microsoft è stata lanciata aggiornamenti ad Azure progettato per gestire i burst degli agenti AI e condividere la memoria tra agenti. Cloudflare, in modo simile advert Amazon, introdotto il mese scorso infrastruttura volta a fornire agli agenti ambienti persistenti e scalabilità istantanea.

Più le aziende implementano agenti IA, maggiore sarà la pressione nel riprogettare l’infrastruttura attorno ai carichi di lavoro generati dalle macchine, il che a sua volta potrebbe rendere gli agenti più economici e più facili da implementare su scala più ampia.

Quando acquisti tramite i hyperlink presenti nei nostri articoli, potremmo guadagnare una piccola commissione. Ciò non pregiudica la nostra indipendenza editoriale.

fonte

LEAVE A REPLY

Please enter your comment!
Please enter your name here