Home Tecnologia Le tre self-discipline che separano le demo degli agenti AI dall’implementazione nel...

Le tre self-discipline che separano le demo degli agenti AI dall’implementazione nel mondo reale

9
0

Far sì che gli agenti IA funzionino in modo affidabile nella produzione, non solo nelle demo, si sta rivelando più difficile di quanto previsto dalle aziende. Dati frammentati, flussi di lavoro poco chiari e tassi di escalation incontrollati stanno rallentando le implementazioni in tutti i settori.

“La tecnologia stessa spesso funziona bene nelle dimostrazioni”, ha affermato Sanchit Vir Gogia, capo analista di Greyhound Analysis. “La sfida inizia quando si chiede di operare all’interno della complessità di un’organizzazione reale.”

Burley Kawasaki, che supervisiona l’implementazione degli agenti presso Creatio, e il staff hanno sviluppato una metodologia costruita attorno a tre self-discipline: virtualizzazione dei dati per aggirare i ritardi del knowledge Lake; dashboard degli agenti e KPI come livello di gestione; e cicli di casi d’uso strettamente delimitati per guidare verso un’elevata autonomia.

Nei casi d’uso più semplici, Kawasaki afferma che queste pratiche hanno consentito agli agenti di gestire da soli fino all’80-90% delle attività. Con un’ulteriore messa a punto, stima che potrebbero supportare la risoluzione autonoma in almeno la metà dei casi d’uso, anche in implementazioni più complesse.

“Le persone hanno sperimentato molto con la dimostrazione dei concetti, hanno fatto molti take a look at”, ha detto Kawasaki a VentureBeat. “Ma ora, nel 2026, stiamo iniziando a concentrarci su flussi di lavoro mission-critical che promuovono efficienze operative o entrate aggiuntive”.

Perché gli agenti continuano a fallire nella produzione

Le aziende sono ansiose di adottare l’intelligenza artificiale agentica in una forma o nell’altra, spesso perché hanno paura di essere escluse, anche prima di identificare casi d’uso tangibili nel mondo reale, ma si imbattono in notevoli colli di bottiglia nell’architettura dei dati, nell’integrazione, nel monitoraggio, nella sicurezza e nella progettazione del flusso di lavoro.

Il primo ostacolo ha quasi sempre a che fare con i dati, ha detto Gogia. Le informazioni aziendali raramente esistono in una forma ordinata o unificata; è distribuito su piattaforme SaaS, app, database interni e altri archivi dati. Alcuni sono strutturati, altri no.

Ma anche quando le aziende superano il problema del recupero dei dati, l’integrazione rappresenta una grande sfida. Gli agenti si affidano advert API e hook di automazione per interagire con le applicazioni, ma molti sistemi aziendali sono stati progettati molto prima che questo tipo di interazione autonoma diventasse realtà, ha sottolineato Gogia.

Ciò può comportare API incomplete o incoerenti e i sistemi possono rispondere in modo imprevedibile quando si accede a livello di codice. Le organizzazioni incontrano ostacoli anche quando tentano di automatizzare processi che non sono mai stati formalmente definiti, ha affermato Gogia.

“Molti flussi di lavoro aziendali dipendono dalla conoscenza tacita”, ha affermato. Cioè, i dipendenti sanno come risolvere le eccezioni che hanno visto prima senza istruzioni esplicite, ma le regole e le istruzioni mancanti diventano sorprendentemente evidenti quando i flussi di lavoro vengono tradotti in logica di automazione.

Il ciclo di sintonizzazione

Creatio distribuisce gli agenti in un “ambito delimitato con guardrail chiari”, seguito da una fase di messa a punto e convalida “esplicita”, ha spiegato Kawasaki. I staff esaminano i risultati iniziali, apportano le modifiche necessarie, quindi riprovano fino a raggiungere un livello accettabile di precisione.

Il ciclo in genere segue questo schema:

  • Ottimizzazione in fase di progettazione (prima del go-live): Le prestazioni vengono migliorate attraverso la tempestiva progettazione, il confezionamento del contesto, le definizioni dei ruoli, la progettazione del flusso di lavoro e il radicamento in dati e documenti.

  • Correzione human-in-the-loop (durante l’esecuzione): Gli sviluppatori approvano, modificano o risolvono le eccezioni. Nei casi in cui gli esseri umani devono intervenire maggiormente (escalation o approvazione), gli utenti stabiliscono regole più forti, forniscono più contesto e aggiornano le fasi del flusso di lavoro; oppure restringeranno l’accesso allo strumento.

  • Ottimizzazione continua (dopo il go-live): Gli sviluppatori continuano a monitorare i tassi di eccezione e i risultati, quindi li ottimizzano ripetutamente secondo necessità, contribuendo a migliorare la precisione e l’autonomia nel tempo.

Il staff di Kawasaki applica la generazione aumentata di recupero agli agenti di terra nelle basi di conoscenza aziendali, nei dati CRM e in altre fonti proprietarie.

Una volta distribuiti, gli agenti vengono monitorati con una dashboard che fornisce analisi delle prestazioni, approfondimenti sulle conversioni e verificabilità. In sostanza, gli agenti sono trattati come lavoratori digitali. Hanno il proprio livello di gestione con dashboard e KPI.

Advert esempio, un agente di onboarding verrà incorporato come interfaccia normal del dashboard che fornisce il monitoraggio e la telemetria degli agenti. Questo fa parte del livello della piattaforma (orchestrazione, governance, sicurezza, esecuzione del flusso di lavoro, monitoraggio e incorporamento dell’interfaccia utente) che si trova “sopra il LLM”, ha affermato Kawasaki.

Gli utenti visualizzano un dashboard degli agenti in uso e ciascuno dei loro processi, flussi di lavoro e risultati eseguiti. Possono “approfondire” un singolo document (come un rinvio o un rinnovo) che mostra un registro di esecuzione passo passo e le relative comunicazioni per supportare la tracciabilità, il debug e la modifica degli agenti. Gli aggiustamenti più comuni riguardano logica e incentivi, regole aziendali, contesto tempestivo e accesso agli strumenti, ha affermato Kawasaki.

I maggiori problemi che emergono dopo la distribuzione:

  • Il quantity di gestione delle eccezioni può essere elevato: I primi picchi nei casi limite si verificano spesso finché i guardrail e i flussi di lavoro non vengono ottimizzati.

  • Qualità e completezza dei dati: Campi e documenti mancanti o incoerenti possono causare escalation; i staff possono identificare a quali dati dare priorità per la messa a terra e quali controlli automatizzare.

  • Controllabilità e fiducia: I clienti regolamentati, in particolare, richiedono registri chiari, approvazioni, controllo degli accessi basato sui ruoli (RBAC) e audit path.

“Spieghiamo sempre che è necessario dedicare tempo alla formazione degli agenti”, ha detto a VentureBeat il CEO di Creatio, Katherine Kostereva. “Non avviene immediatamente quando si accende l’agente, ci vuole tempo per capirlo appieno, poi il numero di errori diminuirà.”

La “prontezza dei dati” non richiede sempre una revisione

Quando si cerca di implementare agenti, “I miei dati sono pronti?” è una delle prime domande comuni. Le aziende sanno che l’accesso ai dati è importante, ma può essere disattivato da un massiccio progetto di consolidamento dei dati.

Ma le connessioni virtuali possono consentire agli agenti di accedere ai sistemi sottostanti e aggirare i tipici ritardi di knowledge lake/lakehouse/warehouse. Il staff di Kawasaki ha creato una piattaforma che si integra con i dati e ora sta lavorando a un approccio che inserirà i dati in un oggetto virtuale, li elaborerà e li utilizzerà come un oggetto normal per interfacce utente e flussi di lavoro. In questo modo, non devono “persistere o duplicare” grandi volumi di dati nel loro database.

Questa tecnica può essere utile in settori come quello bancario, dove i volumi delle transazioni sono semplicemente troppo grandi per essere copiati nel CRM, ma sono “ancora preziosi per l’analisi e i set off dell’intelligenza artificiale”, ha affermato Kawasaki.

Una volta stabilite le integrazioni e gli oggetti virtuali, i staff possono valutare la completezza, la coerenza e la disponibilità dei dati e identificare punti di partenza a basso attrito (come flussi di lavoro ricchi di documenti o non strutturati).

Kawasaki ha sottolineato l’importanza di “utilizzare realmente i dati nei sistemi sottostanti, che tendono advert essere comunque i più puliti o comunque la fonte della verità”.

Agenti corrispondenti al lavoro

La soluzione migliore per gli agenti autonomi (o quasi autonomi) sono flussi di lavoro advert alto quantity con “struttura chiara e rischio controllabile”, ha affermato Kawasaki. Advert esempio, l’assunzione e la convalida dei documenti durante l’onboarding o la preparazione del prestito, oppure attività di sensibilizzazione standardizzate come rinnovi e segnalazioni.

“Soprattutto quando puoi collegarli a processi molto specifici all’interno di un settore: è lì che puoi davvero misurare e ottenere un ROI significativo”, ha affermato.

Advert esempio, gli istituti finanziari sono spesso isolati per natura. I staff di prestito commerciale operano nel proprio ambiente, la gestione patrimoniale in un altro. Ma un agente autonomo può esaminare diversi dipartimenti e archivi dati separati per identificare, advert esempio, clienti commerciali che potrebbero essere buoni candidati per la gestione patrimoniale o i servizi di consulenza.

“Pensi che sarebbe un’opportunità ovvia, ma nessuno sta guardando tutti i silos”, ha detto Kawasaki. Alcune banche che hanno applicato gli agenti proprio a questo state of affairs hanno visto “benefici di milioni di dollari di entrate incrementali”, ha affermato, senza nominare istituzioni specifiche.

Tuttavia, in altri casi – in particolare nei settori regolamentati – gli agenti con un contesto più lungo non sono solo preferibili, ma necessari. Advert esempio, in attività in più fasi come la raccolta di show tra sistemi, il riepilogo, il confronto, la stesura di comunicazioni e la produzione di motivazioni verificabili.

“L’agente non ti dà una risposta immediata”, ha detto Kawasaki. “Potrebbero essere necessarie ore, giorni, per completare le attività end-to-end full.”

Ciò richiede un’esecuzione orchestrata degli agenti piuttosto che un “singolo gigantesco suggerimento”, ha affermato. Questo approccio suddivide il lavoro in passaggi deterministici che devono essere eseguiti dai sub-agenti. La gestione della memoria e del contesto può essere mantenuta attraverso vari passaggi e intervalli di tempo. Il radicamento con RAG può aiutare a mantenere gli output legati alle fonti approvate e gli utenti hanno la possibilità di dettare l’espansione alle condivisioni di file e advert altri repository di documenti.

Questo modello in genere non richiede una riqualificazione personalizzata o un nuovo modello di base. Qualunque sia il modello utilizzato dalle aziende (GPT, Claude, Gemini), le prestazioni migliorano attraverso suggerimenti, definizioni di ruoli, strumenti controllati, flussi di lavoro e messa a terra dei dati, ha affermato Kawasaki.

Il ciclo di suggestions pone “ulteriore enfasi” sui checkpoint intermedi, ha affermato. Gli esseri umani esaminano gli artefatti intermedi (come riepiloghi, fatti estratti o bozze di raccomandazioni) e correggono gli errori. Questi possono quindi essere convertiti in regole e fonti di recupero migliori, ambiti di strumenti più ristretti e modelli migliorati.

“Ciò che è importante per questo stile di agente autonomo è che si mescola il meglio di entrambi i mondi: il ragionamento dinamico dell’intelligenza artificiale, con il controllo e la potenza della vera orchestrazione”, ha affermato Kawasaki.

In definitiva, gli agenti richiedono cambiamenti coordinati nell’architettura aziendale, nuovi framework di orchestrazione e controlli di accesso espliciti, ha affermato Gogia. Agli agenti devono essere assegnate identità per limitare i loro privilegi e mantenerli entro i limiti. L’osservabilità è fondamentale; gli strumenti di monitoraggio possono registrare i tassi di completamento delle attività, gli eventi di escalation, le interazioni del sistema e i modelli di errore. Questo tipo di valutazione deve essere una pratica permanente e gli agenti dovrebbero essere testati per vedere come reagiscono quando incontrano nuovi scenari e enter insoliti.

“Nel momento in cui un sistema di intelligenza artificiale può entrare in azione, le aziende devono rispondere a various domande che raramente compaiono durante le implementazioni del copilota”, ha affermato Gogia. Advert esempio: a quali sistemi è consentito l’accesso all’agente? Quali tipi di azioni può eseguire senza approvazione? Quali attività devono sempre richiedere una decisione umana? Come verrà registrata e rivista ogni azione?

“Quelli [enterprises] che sottovalutano la sfida spesso si ritrovano bloccati in dimostrazioni che sembrano impressionanti ma che non riescono a sopravvivere alla reale complessità operativa”, ha affermato Gogia.

fonte

LEAVE A REPLY

Please enter your comment!
Please enter your name here