Home Tecnologia Il nuovo Fin Apex 1.0 post-addestrato di Intercom batte GPT-5.4 e Claude...

Il nuovo Fin Apex 1.0 post-addestrato di Intercom batte GPT-5.4 e Claude Sonnet 4.6 nelle risoluzioni del servizio clienti

8
0

Citofono sta prendendo una scommessa insolita per una società di software program legacy: costruire il proprio modello di intelligenza artificiale.

La quindicenne piattaforma di assistenza clienti con sede a Dublino, Irlanda annunciato Fin Apex 1.0 giovedì, un piccolo modello di intelligenza artificiale appositamente creato che, secondo l’azienda, supera i principali modelli di frontiera di OpenAI e Anthropic sui parametri che contano di più per l’assistenza clienti.

I poteri del modello L’agente Fin AI esistente di Intercomche gestisce già oltre un milione di conversazioni settimanali con i clienti.

Secondo i benchmark condivisi con VentureBeat, Fin Apex 1.0 raggiunge un tasso di risoluzione del 73,1% (la percentuale di problemi dei clienti completamente risolti senza intervento umano) rispetto al 71,1% sia per GPT-5.4 che per Claude Opus 4.5, e al 69,6% per Claude Sonnet 4.6. Questo margine di circa 2 punti percentuali può sembrare modesto, ma è più ampio del tipico divario tra le generazioni successive di modelli di frontiera.

Fin Apex 1.0 seleziona la tabella comparativa dei benchmark. Credito: citofono

“Se gestisci operazioni di servizi di grandi dimensioni su larga scala e hai 10 milioni di clienti o un miliardo di dollari di entrate, un delta del 2% o 3% è una quantità davvero grande di clienti, interazioni e entrate”, ha detto a VentureBeat il CEO di Intercom Eoghan McCabe in un’intervista in videochiamata all’inizio di questa settimana.

Il modello mostra anche miglioramenti significativi in ​​termini di velocità e precisione. Fin Apex fornisce risposte in 3,7 secondi, 0,6 secondi più velocemente del concorrente più veloce, e dimostra una riduzione del 65% delle allucinazioni rispetto a Claude Sonnet 4.6.

Forse la cosa più sorprendente per gli acquirenti aziendali: costa circa un quinto del costo dell’utilizzo diretto dei modelli di frontiera ed è incluso nella struttura tariffaria esistente di Intercom basata “per risultato” per i suoi piani clienti esistenti.

Qual è il modello base? Ha importanza?

Ma c’è un problema. Quando è stato chiesto di specificare su quale modello base è stato costruito Apex e le dimensioni dei parametri, Intercom ha rifiutato.

“Non condividiamo il modello base utilizzato per Apex 1.0, per ragioni aggressive e anche perché prevediamo di cambiare modello base nel tempo”, ha detto a VentureBeat un portavoce dell’azienda. L’azienda conferma solo che il modello ha “le dimensioni di centinaia di milioni di parametri”.

Questo è un modello particolarmente piccolo. Per fare un confronto, Meta’s Llama 3.1 varia da 8 miliardi a 405 miliardi di parametri; anche modelli efficienti a peso aperto come Mistral 7B fanno impallidire la scala inferiore al miliardo descritta da Intercom.

Se le prestazioni dichiarate da Apex reggano rispetto a quel contesto, o se i benchmark riflettano ottimizzazioni possibili solo in applicazioni ristrette e specifiche del dominio, rimane una questione aperta.

Intercom afferma di aver imparato dal contraccolpo che la startup di codifica AI Cursor ha dovuto affrontare quando i critici hanno accusato l’assistente di codifica di seppellire il fatto che il suo modello Composer 2 period costruito su modelli open-weight ottimizzati piuttosto che su tecnologia proprietaria. Ma la lezione che Intercom ha tratto potrebbe non soddisfare gli scettici: la società è trasparente nel dire che ha utilizzato una base a pesi aperti, ma non Quale uno.

“Siamo molto trasparenti nell’utilizzare un modello a pesi aperti”, ha affermato il portavoce. Tuttavia, rifiutarsi di dare un nome al modello rivendicandone la trasparenza è una contraddizione che probabilmente attirerà l’attenzione, in particolare perché sempre più aziende pubblicizzano l’intelligenza artificiale “proprietaria” che equivale a fondazioni open supply post-addestrate.

Il post-allenamento come nuova frontiera

La tesi di Intercom è che il modello base semplicemente non ha più molta importanza.

“La pre-formazione è una specie di merce ora”, ha detto McCabe. “La frontiera, se vuoi, è in realtà nel post-formazione. Il post-formazione è la parte difficile. Hai bisogno di dati proprietari. Hai bisogno di fonti di verità proprietarie.”

L’azienda ha sottoposto a formazione successiva la base prescelta utilizzando anni di dati proprietari sul servizio clienti accumulati tramite Fin, che ora risolve 2 milioni di domande dei clienti a settimana. Questo processo implicava qualcosa di più della semplice immissione di trascrizioni in un modello. Intercom ha costruito sistemi di apprendimento per rinforzo basati su risultati di risoluzione reali, insegnando al modello come si presenta effettivamente un servizio clienti di successo: il tono appropriato, le chiamate di giudizio, la struttura della conversazione e, in modo critico, come riconoscere quando un problema è veramente risolto rispetto a quando un cliente è ancora frustrato.

“I modelli generici vengono addestrati su dati generici su Web. I modelli specifici vengono addestrati su dati di dominio iperspecifici”, ha spiegato McCabe. “È ovvio quindi che l’intelligenza dei modelli generici è generica, mentre l’intelligenza dei modelli specifici è specifica del dominio e quindi opera in un modo di gran lunga superiore per quel caso d’uso.”

Se McCabe ha ragione nel dire che la magia sta tutta nel post-allenamento, la riluttanza a dare un nome alla base diventa più difficile da giustificare. Se il fondamento è veramente intercambiabile, quale vantaggio competitivo protegge la segretezza?

Una scommessa da 100 milioni di dollari che sta dando i suoi frutti

L’annuncio arriva quando il primo perno AI di Intercom sembra funzionare. Fin si avvicina ai 100 milioni di dollari di entrate ricorrenti annuali e cresce di 3,5 volte, diventando così il segmento in più rapida crescita del enterprise ARR da 400 milioni di dollari dell’azienda. Si prevede che Fin rappresenterà la metà dei ricavi totali di Intercom all’inizio del prossimo anno.

Questa traiettoria rappresenta una svolta notevole. Quando Fin è stato lanciato, il suo tasso di risoluzione period solo del 23%. Oggi la media è del 67% tra i clienti, con alcune implementazioni aziendali di grandi dimensioni che raggiungono tassi fino al 75%.

Per far sì che ciò accadesse, Intercom ha ampliato il suo staff di intelligenza artificiale da circa 6 ricercatori a 60 negli ultimi tre anni: un investimento significativo per un’azienda che, ammette McCabe, period “in una brutta situazione” prima della sua svolta nell’intelligenza artificiale. Il tasso di crescita medio per le società di software program pubbliche si aggira intorno all’11%; Intercom prevede di raggiungere una crescita del 37% quest’anno.

“Siamo di gran lunga i primi nella categoria advert addestrare il nostro modello”, ha affermato McCabe. “Non c’è nessun altro che lo avrà per un anno o più.”

La speciazione e la specializzazione dell’IA

La tesi di McCabe è in linea con una tendenza più ampia che Andrej Karpathy, ex chief dell’intelligenza artificiale presso Tesla e OpenAI, ha recentemente descritto come la “speciazione” dei modelli di intelligenza artificiale: una proliferazione di sistemi specializzati ottimizzati per compiti ristretti piuttosto che per l’intelligenza generale.

Il servizio clienti, sostiene McCabe, è particolarmente adatto per questo approccio. È uno dei soli due o tre casi d’uso dell’intelligenza artificiale aziendale che finora hanno trovato una reale trazione economica, insieme agli assistenti di codifica e all’intelligenza artificiale potenzialmente legale. Ciò ha attratto oltre un miliardo di dollari in finanziamenti di enterprise capital a concorrenti come Decagon e Sierra e ha reso lo spazio, nelle parole di McCabe, “spietatamente competitivo”.

La domanda è se i modelli specifici del dominio rappresentino un vantaggio duraturo o un arbitraggio temporaneo che i laboratori di frontiera alla fantastic chiuderanno. McCabe ritiene che i laboratori debbano affrontare limitazioni strutturali.

“Forse il futuro è che Anthropic avrà una grande offerta di molti modelli specializzati diversi. Forse è quello che sembra,” ha detto. “Ma la realtà è che non credo che i modelli generici saranno in grado di tenere il passo con i modelli specifici del dominio in questo momento.”

Oltre l’efficienza, l’esperienza

L’adozione iniziale dell’IA nelle imprese si è concentrata fortemente sulla riduzione dei costi, sostituendo costosi agenti umani con agenti automatizzati più economici. Ma McCabe vede la conversazione spostarsi verso la qualità dell’esperienza.

“All’inizio period come, ‘Porca miseria, possiamo farlo davvero a un prezzo molto più basso.’ E ora pensano: ‘Aspetta, no, possiamo offrire ai clienti un’esperienza molto migliore'”, ha detto.

La visione va oltre la semplice risoluzione delle question. McCabe immagina agenti IA che funzionano come consulenti: il bot di un rivenditore di scarpe che non si limita a rispondere alle domande sulla spedizione, ma offre consigli di stile e mostra ai clienti come potrebbero apparire le numerous opzioni su di loro.

“Il servizio clienti è sempre stato pessimo”, ha detto senza mezzi termini McCabe. “Anche i marchi migliori restano in attesa di una chiamata, vengono sbattuti in diversi reparti. Ora c’è l’opportunità di fornire un’esperienza cliente davvero perfetta.”

Prezzi e disponibilità

Per i clienti Fin esistenti, l’aggiornamento advert Apex non prevede costi aggiuntivi. Intercom ha confermato che i prezzi per i clienti rimangono invariati: gli utenti continuano a pagare in base al risultato come prima, a 0,99 dollari per interazione risolta, e beneficiano automaticamente del nuovo modello.

Apex non è disponibile come modello autonomo o tramite un’API esterna. È accessibile solo tramite Fin, il che significa che le aziende non possono concedere in licenza il modello in modo indipendente o integrarlo nei propri prodotti. Questo vincolo può limitare la capacità di Intercom di monetizzare il modello oltre la sua base di clienti esistente, ma mantiene anche la tecnologia proprietaria in senso pratico, indipendentemente da quale risulti essere il modello base sottostante.

Qual è il prossimo passo?

Intercom prevede di espandere Fin oltre il servizio clienti nelle vendite e nel advertising and marketing, posizionandolo come un concorrente diretto della visione Agentforce di Salesforce, che mira a fornire agenti AI durante tutto il ciclo di vita del cliente.

Per il settore SaaS in generale, la mossa di Intercom solleva domande scomode. Se una società di servizi clienti di 15 anni riesce a costruire un modello che surclassa OpenAI e Anthropic nel suo settore, cosa significa questo per i fornitori che fanno ancora affidamento su chiamate API generiche? E se “la post-formazione è la nuova frontiera”, come insiste McCabe, le aziende che rivendicano innovazioni subiranno pressioni per mostrare il proprio lavoro o continueranno a nascondersi dietro il segreto competitivo pubblicizzando la trasparenza?

La risposta di McCabe alla prima domanda, presentato in un recente post su LinkedInè netto: “Se non puoi diventare una società di agenti, il tuo enterprise di app CRUD avrà un futuro in diminuzione”.

Resta da vedere la risposta alla seconda.

fonte

LEAVE A REPLY

Please enter your comment!
Please enter your name here