Home Tecnologia La ricostruzione del recupero: perché l’intento del recupero ibrido è triplicato quando...

La ricostruzione del recupero: perché l’intento del recupero ibrido è triplicato quando i programmi RAG aziendali hanno raggiunto il limite della scalabilità

11
0

Qualcosa è cambiato nel RAG aziendale nel primo trimestre del 2026. I dati VB Pulse da gennaio a marzo raccontano una storia coerente: il mercato ha smesso di aggiungere livelli di recupero e ha iniziato a correggere quelli che già disponeva. Chiamatela ricostruzione del recupero.

L’indagine ha coperto tre ondate mensili consecutive di organizzazioni con 100 o più dipendenti, con un numero di intervistati qualificati compreso tra 45 e 58 al mese in base all’adozione della piattaforma, alle intenzioni dell’acquirente, alle prospettive dell’architettura e ai criteri di valutazione. I dati dovrebbero essere trattati come direzionali.

L’intenzione delle aziende di adottare il recupero ibrido è triplicata, passando dal 10,3% al 33,3% in un solo trimestre, anche se il 22% degli intervistati aziendali qualificati ha riferito di non avere alcun sistema RAG di produzione. Per gli ingegneri dei dati e gli architetti aziendali che costruiscono infrastrutture di intelligenza artificiale, i dati rivelano un mercato in transizione attiva: l’architettura RAG costruita per scalare dalla maggior parte delle aziende non è quella che si aspettano di gestire entro la wonderful dell’anno.

Credito: sondaggio VentureBeat Pulse

Il recupero ibrido è diventato la strategia aziendale più diffusa. A differenza delle pipeline RAG a metodo singolo che si basano esclusivamente sulla somiglianza vettoriale, il recupero ibrido combina densi incorporamenti con ricerca di parole chiave sparse e livelli di riclassificazione, barattando la semplicità con l’accuratezza del recupero e il controllo degli accessi richiesti dai carichi di lavoro degli agenti di produzione.

La categoria dei database vettoriali indipendenti è sotto pressione. Secondo i dati VB Pulse, Weaviate, Milvus, Pinecone e Qdrant hanno perso quote di adozione nel corso del trimestre. Gli stack personalizzati e il recupero nativo del supplier stanno assorbendo la loro quota spostata.

Una minoranza crescente di imprese si sta ritirando del tutto dal RAG, un segnale che la narrazione della maturità del mercato presenta eccezioni significative.

Le organizzazioni che hanno adottato RAG nel 2025 stanno toccando lo stesso punto di fallimento: l’architettura costruita per il recupero dei documenti non regge su scala di agenti.

Le aziende che hanno rapidamente scalato RAG stanno ora pagando per ricostruirlo

I due maggiori movimenti di intenti nel primo trimestre sono direttamente collegati: le imprese che affrontano problemi di qualità del recupero su larga scala e il recupero ibrido che emerge come risposta consensuale.

Le priorità di investimento sono cambiate parallelamente. La valutazione e i take a look at di pertinenza hanno portato l’intenzione di bilancio a gennaio al 32,8% ed è scesa al 15,6% a marzo. L’ottimizzazione del recupero si è spostata nella direzione opposta, dal 19,0% al 28,9%, superando per la prima volta la valutazione come space di investimento con la massima crescita.

VB RAG sondaggi sulle priorità di investimento

Credito: sondaggio VentureBeat Pulse

Steven Dickens, vicepresidente e responsabile della pratica presso HyperFRAME Analysis, ha descritto il carico operativo che i crew dati aziendali devono affrontare in un’intervista a VentureBeat a marzo sullo stack di dati AI agentic di Oracle. “I knowledge crew sono esausti a causa della fatica dovuta alla frammentazione”, ha affermato Dickens. “Gestire un archivio vettoriale, un database a grafo e un sistema relazionale separati solo per alimentare un agente è un incubo DevOps.”

Questa fatica si manifesta direttamente nei dati della piattaforma. L’aumento dello stack personalizzato al 35,6% non rappresenta un rifiuto del recupero gestito: molte organizzazioni li eseguono entrambi. È una risposta di consolidamento da parte dei crew di ingegneri che hanno raggiunto i limiti dell’assemblaggio di troppi componenti.

Non tutte le imprese sono arrivate a questo punto. I dati VB Pulse includono un segnale che complica il quadro generale della crescita del mercato: il 22,2% degli intervistati qualificati non ha segnalato alcun RAG di produzione entro marzo, rispetto all’8,6% di gennaio. Il rapporto attribuisce questo gruppo alle organizzazioni che “non si sono ancora impegnate in alcuna infrastruttura di recupero, o hanno sospeso i programmi” – focus nella sanità, nell’istruzione e nel governo, gli stessi settori che mostrano i più alti tassi di price range piatto.

I database vettoriali autonomi stanno perdendo l’argomento dell’adozione ma vincendo quello dell’affidabilità

Un recente rapporto di VentureBeat illustra perché il livello di recupero dedicato è ancora importante nella produzione.

Due aziende che si basano su Qdrant mostrano perché l’infrastruttura vettoriale appositamente costruita vince ancora nella produzione.

&AI crea un’infrastruttura per le controversie sui brevetti ed esegue la ricerca semantica su centinaia di milioni di documenti. Fondare ogni risultato in un documento sorgente reale non è facoltativo: gli avvocati specializzati in brevetti non agiranno sul testo generato dall’intelligenza artificiale. Questo requisito rende chiara la scelta architettonica.

“L’agente è l’interfaccia”, ha detto a VentureBeat Herbie Turner, fondatore e CTO di &AI, a marzo. “Il database vettoriale è la verità fondamentale.”

GlassDollar, una startup che aiuta Siemens e Mahle a valutare le startup, esegue un modello di recupero tramite agenti su un corpus che si avvicina ai 10 milioni di documenti indicizzati. Un singolo utente richiede di suddividersi in più question parallele, ciascuna delle quali recupera i candidati da un’angolazione diversa prima che i risultati vengano combinati e riclassificati. Il quantity delle question e i requisiti di precisione sono ciò che ha guidato la scelta di un’infrastruttura vettoriale appositamente creata.

“Misuriamo il successo in base al richiamo”, ha detto a VentureBeat Kamen Kanev, responsabile del prodotto GlassDollar, a marzo. “Se le migliori aziende non compaiono nei risultati, nient’altro conta. L’utente perde fiducia.”

I dati di VB Pulse mostrano che il framing, ovvero il recupero come verità fondamentale piuttosto che come funzionalità, sta guadagnando terreno nel più ampio mercato aziendale, anche se l’adozione di database vettoriali autonomi è in declino.

Il motivo per cui le aziende affermano di aver bisogno di un livello vettoriale dedicato è cambiato in modo significativo nel primo trimestre. A gennaio i motivi principali erano la complessità del controllo degli accessi (20,7%) e la precisione del recupero (19,0%). A marzo, l’affidabilità operativa su larga scala period salita al 31,1%, più che raddoppiando e superando tutto il resto. Le aziende non mantengono più l’infrastruttura vettoriale principalmente per la precisione. Lo mantengono perché è la parte dello stack su cui possono fare affidamento quando i volumi delle question aumentano.

Come le aziende stanno ridefinendo il significato di buon recupero

Il modo in cui le aziende giudicano i propri sistemi di recupero è cambiato notevolmente nel primo trimestre e la direzione di questo cambiamento indica un mercato sempre più sofisticato su cosa significhi effettivamente un buon recupero.

A gennaio, la correttezza delle risposte dominava i criteri di valutazione con il 67,2%, molto al di sopra di qualsiasi altra cosa. A marzo, la correttezza della risposta (53,3%), l’accuratezza del recupero (53,3%) e la pertinenza della risposta (53,3%) convergevano esattamente. Ottenere la risposta giusta non è più sufficiente se proviene dal documento sbagliato o se non si coglie il contesto della domanda.

La pertinenza della risposta è stato l’unico criterio che è aumentato nel corso del trimestre, guadagnando cinque punti percentuali. È anche il più difficile da misurare: se il contesto recuperato è effettivamente il contesto giusto per quella domanda specifica richiede un’infrastruttura di valutazione appositamente costruita, non solo controlli di correttezza se superato o fallito. Il suo aumento segnala che una quota significativa di acquirenti aziendali ha superato completamente i take a look at RAG di base.

Valutazione migliore del sondaggio VB RAG

Credito: sondaggio VentureBeat Pulse

Il verdetto del mercato: RAG non è morta. L’architettura originale è

La narrativa “RAG è morto” ha avuto un vero slancio nel 2026. Si basava su due affermazioni. Il primo: che le finestre a contesto lungo – modelli in grado di elaborare centinaia di migliaia di token in un unico immediate – renderebbero superfluo il recupero dedicato. Il secondo: che i sistemi di memoria dell’agente, che immagazzinano ciò che un agente apprende nel corso delle sessioni invece di recuperarlo ogni volta, assorbirebbero completamente il problema dell’accesso alla conoscenza.

I dati VB Pulse sono la risposta del mercato enterprise alla prima affermazione. La posizione di contesto a lungo termine come architettura dominante è crollata dal 15,5% di gennaio al 3,5% di febbraio prima di recuperare parzialmente al 6,7% di marzo. Il campione di gennaio period fortemente orientato verso gli intervistati del settore tecnologico e software program, il segmento più esposto agli annunci di modelli a lungo contesto alla wonderful del 2025. Man mano che il campione si diversificava, la posizione è evaporata.

Sulla questione della memoria, Jonathan Frankle, capo scienziato dell’intelligenza artificiale presso Databricks, ha inquadrato chiaramente l’architettura in un’intervista di marzo con VentureBeat: un database vettoriale con milioni di voci si trova alla base dello stack di memoria dell’agente, troppo grande per adattarsi al contesto. La finestra del contesto LLM si trova in alto. Tra di essi stanno emergendo nuovi livelli di memorizzazione nella cache e di compressione, ma nessuno di essi sostituisce il livello di recupero alla base. Nuovi sistemi di memoria advert agenti come Hindsight, sviluppato da Vectorize, e approcci di memoria osservativa come quelli nel framework Mastra affrontano la continuità della sessione e il contesto dell’agente nel tempo: un problema diverso rispetto alla ricerca advert alto ricordo tra milioni di documenti aziendali in continuo cambiamento.

Il segnale più significativo è che la percentuale di intervistati che non si aspettano implementazioni RAG su larga scala entro la wonderful dell’anno è cresciuta dal 3,4% al 15,6%, quasi 5 volte. Questo non è un verdetto contro il recupero. Si tratta di un verdetto contro l’architettura di recupero che la maggior parte delle aziende ha costruito per prima.

L'indagine VB RAG prevedeva un'architettura dominante

Credito: sondaggio VentureBeat Pulse

La ricostruzione del recupero non è facoltativa

La ricostruzione di recupero rappresenta il costo del ridimensionamento di RAG senza prima decidere quale architettura potrebbe effettivamente supportarla.

Se la tua organizzazione rientra nel 43,1% che ha avviato la pianificazione del primo trimestre per espandere RAG in più flussi di lavoro, i dati VB Pulse suggeriscono che il piano è già cambiato per molti dei tuoi colleghi e potrebbe essere necessario farlo anche per te. Il recupero ibrido è la destinazione del consenso. La crescita dello stack personalizzato al 35,6% riflette i crew che costruiscono un’infrastruttura di recupero attorno a requisiti che i prodotti customary non soddisfano completamente.

RAG non è morto. L’architettura utilizzata dalla maggior parte delle aziende per implementarlo è. I dati suggeriscono che la ricostruzione non è una decisione futura. Per il 33% delle imprese la ricostruzione è già una priorità dichiarata.

fonte

LEAVE A REPLY

Please enter your comment!
Please enter your name here