Le architetture RAG sono courageous in una cosa: far emergere documenti semanticamente rilevanti. È anche lì che si fermano.
Una struttura chiamata grafico del contesto decisionale colma questa lacuna fornendo agli agenti memoria strutturata, ragionamento consapevole del tempo e logica decisionale esplicita. Ondulazioneuna startup nell’ecosistema Neo4j, ne ha costruito uno. La capacità chiave: agenti non regressivi, in grado di congelare sequenze di azioni convalidate e di combinarle nel tempo.
“Il punto chiave che desideri è la non regressività: come puoi assicurarti che, quando l’agente genererà qualcosa di nuovo, tu possa ampliare le scoperte precedenti?” ha detto Yann Bilien, co-fondatore e direttore scientifico di Rippletid.
Perché RAG non va abbastanza lontano
Il contesto aziendale è distribuito tra strumenti ERP, registri, database, archivi di vettori e documenti politici. Gli strumenti di intelligenza artificiale generativa possono recuperare da tutto ciò, tramite ricerca di parole chiave, question SQL o pipeline RAG full, ma il recupero ha un limite.
In particolare, i dati recuperati potrebbero non essere rilevanti per la decisione in questione (causando così allucinazioni); e, anche se gli agenti raccolgono i dati giusti, spesso non dispongono di una guida per prendere decisioni supportate da una forte motivazione.
Cioè, RAG recupera i documenti, non il contesto decisionale. “Tutti iniziano con RAG: raccogli i documenti rilevanti, inseriscili nel immediate, lascia che sia il modello a capirlo”, ha affermato Wyatt Mayham di Consulenza sull’intelligenza artificiale nordoccidentale.
Sebbene funzioni bene per i chatbot, “si interrompe immediatamente” per gli agenti che devono prendere decisioni e intraprendere azioni, ha sottolineato. “La cosa più importante con cui i costruttori lottano è il divario tra recupero e applicabilità.”
Un documento recuperato non cube all’agente se è ancora valido, se è stato sostituito o se esiste una regola in conflitto che ha la priorità, ha affermato Mayham. “Gli agenti hanno bisogno del contesto decisionale, non solo delle informazioni”.
Nell’edilizia (il mondo umano), ciò potrebbe significare sapere che un’eccezione tariffaria è scaduta, che una politica di sicurezza si applica solo in determinate giurisdizioni o che una procedura operativa normal è stata aggiornata un mese prima. “Perdere tutto ciò, e l’agente con sicurezza farà la cosa sbagliata”, ha detto Mayham.
Senza un contesto decisionale strutturato, gli agenti combinano regole incompatibili, inventano vincoli per colmare le lacune e fanno affidamento su ciò che Bilien chiama “ipotesi probabilistiche su dati illimitati”. Gli errori sono difficili da riprodurre perché i costruttori non possono risalire al motivo per cui l’agente ha fatto una determinata scelta.
Anche il problema dell’errore di composizione è reale, ha affermato Mayham: un piccolo tasso di errori per passaggio diventa “catastrofico” in un flusso di lavoro a più fasi. “Questo è il motivo principale per cui la maggior parte degli agenti aziendali non abbandona mai la fase pilota.”
Come i grafici del contesto decisionale arrivano alla risposta pertinente
Un grafico del contesto decisionale risolve questo problema codificando una mappa strutturata di ciò che è applicabile, quali sono le regole e quando si applicano.
Il quadro è ottimizzato per una domanda: “Information questa situazione, quale contesto si applica in questo momento?” Il tempo è trattato come una dimensione di prima classe; ogni regola, decisione ed eccezione è limitata al momento in cui è valida.
“L’obiettivo è affrontare esplicitamente i dati mancanti, incoerenti o contraddittori durante la costruzione del grafico per evitare dati probabilistici [errors] una volta che l’agente è in funzione”, ha detto Bilien.
Il sistema si basa su tre principi:
-
Applicabilità: La logica è codificata esplicitamente in modo che l’agente sappia quali regole ricordare e applicare in una determinata situazione. Il contesto viene restituito solo quando è rilevante per la situazione.
-
Memoria sensibile al tempo: Ogni regola, decisione ed eccezione ha una durata temporale. Ciò consente agli agenti di ragionare su “Ciò che period vero allora rispetto a ciò che è vero adesso”, quindi riprodurre o spiegare le sue decisioni.
-
Percorsi decisionali: Il sistema può spiegare come è passato da A a B e il “perché” dietro la sua logica (advert esempio, perché un elemento del contesto è stato incluso e un altro no). Agli agenti vengono forniti esempi di “percorso decisionale” di come casi simili venivano gestiti in precedenza.
Durante la configurazione, i dati non strutturati vengono inseriti e strutturati in un’ontologia: quali entità esistono, quali regole si applicano, cosa conta come eccezione. L’intelligenza artificiale neurosimbolica gestisce il riconoscimento dei modelli e codifica la logica formale leggibile dalla macchina. Nel tempo, il sistema affina la propria base di conoscenza man mano che vengono prese nuove decisioni.
“La neuro-simbolica comprende due parti: una parte neuronale che dà una grande autonomia agli agenti e una parte simbolica per ridurre il numero di dati necessari e portare il controllo”, ha detto Bilien.
L’agente viene testato in fase di creazione (pre-produzione) per convalidarne i comportamenti o individuare miglioramenti. Ciò riduce i rischi e le esigenze di calcolo durante l’inferenza, ha osservato.
Gli agenti imparano, invece di regredire
Quando si tratta di non regressione, l’elemento chiave è l’aggregazione sia dell’intelligenza (modelli) che della conoscenza (condivisa tra gli agenti), ha affermato Bilien. È importante che gli agenti possano esplorare; quando non sanno come portare a termine un compito, possono tentare various possibilità, tipicamente in un ambiente controllato o in una simulazione (come un bot di supporto che prova modelli di risposta multipla).
Quindi, “una volta che una soluzione viene valutata come soddisfacente, il grafico congela quella sequenza di azioni”, ha detto Bilien. L’esplorazione futura parte quindi da questa “base stabile di comportamenti validati” per evitare che le competenze appena acquisite sovrascrivano i buoni comportamenti precedentemente appresi.
Prima che un agente agisca o influenzi un cliente, controlla il grafico: sta violando una regola? Allucinante? Rimanere nei limiti? Può generalizzare la soluzione a casi simili?
A livello macro, il sistema valuta i risultati: il comportamento ha migliorato le prestazioni a lungo termine? Si è generalizzato in contesti simili? Ha preservato le capacità precedenti?
“Questo determinismo è fondamentale affinché gli agenti possano garantire l’affidabilità su larga scala”, ha affermato Bilien. Porta a comportamenti più coerenti, prevedibili, spiegabili e che consentono un controllo e una verificabilità più forti.
“Vuoi che i tuoi agenti siano in grado di imparare da soli quando si trovano advert affrontare qualcosa che non conoscono”, ha detto. “Vuoi che siano in grado di esplorare e trovare nuove soluzioni.”
Andare oltre la memoria “episodica”.
Sebbene inizialmente il group presumesse che avrebbe implementato RL ovunque, “in realtà ciò si è rivelato molto difficile in un contesto aziendale”, ha affermato Bilien. “I dati sono scarsi per alcuni casi d’uso specifici e confusi per altri.”
In genere, l’utilizzo dei dati grezzi per previsioni affidabili è stata una sfida manuale e dispendiosa in termini di tempo, ma “ora con gli agenti siamo entrati in una nuova period in cui la costruzione di ontologie è possibile automaticamente”, ha affermato Bilien.
I classici metodi di messa a punto supervisionati possono portare a oscillazioni, quando i modelli dimenticano l’ultima abilità appresa mentre imparano il tono successivo. Nel complesso, l’apprendimento non è aggravato, la compressione è “drammatica” e i modelli migliorano “episodicamente” anziché continuamente, portandoli a fallire continuamente su compiti nuovi o invisibili.
Come ha osservato Bilien: “Non avrai mai un modello di autoapprendimento completo se regredisci ogni volta”.
Nei casi d’uso aziendali, come nel settore bancario in cui vengono elaborate milioni di transazioni al giorno, un elevato livello di affidabilità è fondamentale, ha osservato. “Una domanda che pongo a tutti i clienti: il 95% è sufficiente? In molti casi d’uso, non lo è. Hai bisogno del 99,999%. Uno sconto dell’1% è decisamente troppo.”
I grafici del contesto decisionale possono colmare questa lacuna, sostiene: quando la stessa domanda di assistenza clienti viene posta ripetutamente, l’agente restituirà una risposta “soddisfacente” in modo prevedibile e senza regressione, il tutto mantenendo l’autonomia.
Codificare l’applicabilità e la validità temporale in un grafico strutturato – piuttosto che fare affidamento su un LLM per dedurlo – è un “approccio valido” a una limitazione reale nei quadri di recupero esistenti, ha affermato Mayham. La questione aperta è se la generazione automatica di ontologie resista ai dati disordinati e diversificati di cui effettivamente dispongono le aziende. “Questa è sempre la parte difficile”, ha detto.












