Nvidia ha rilasciato una nuova intelligenza artificiale (AI) open supply progettata per gestire flussi di lavoro complessi. Soprannominato Nemotron 3 Tremendous, è un modello ibrido di miscela di esperti (MoE) che combina capacità di ragionamento avanzate e si cube che completi le attività con elevata precisione per agenti autonomi. Il nuovo modello è già stato implementato da various aziende di intelligenza artificiale, tra cui Perplexity, per la sua nuova piattaforma informatica advert agenti. Inoltre, è ospitato anche su repository pubblici per consentire alle persone interessate di scaricare ed eseguire il modello localmente.
Rilasciato il modello Tremendous AI di Nvidia Nemotron 3
Nell’a articolo del blogil gigante della tecnologia ha annunciato e dettagliato il nuovo modello di intelligenza artificiale open supply. Parte della famiglia Nemotron 3, Nemotron 3 Tremendous è attualmente ospitato sul sito Internet di Nvidia, sulla piattaforma Hugging Face, Perplexity e OpenRouter. Inoltre, verrà portato anche su Dell Enterprise Hub ed è ottimizzato per la distribuzione in sede su Dell AI Manufacturing facility.
L’ultimo modello risolve il problema del contesto e dell’aumento del costo del ragionamento. I modelli di intelligenza artificiale sviluppati per i flussi di lavoro degli agenti tendono a generare un numero maggiore di token, poiché l’interazione di ciascun agente o sottoagente richiede l’invio dell’intero contesto. Allo stesso modo, l’esecuzione di compiti complessi richiede una riflessione multilivello, che può aumentare sostanzialmente i costi di gestione del modello.
Con la sua architettura ibrida, il Nemotron 3 Tremendous è dotato di un totale di 120 miliardi di parametri e 12 miliardi di parametri attivi. Dispone inoltre di una finestra di contesto di un milione di token, che consente agli agenti di conservare la memoria completa del flusso di lavoro. Inoltre, il suo sviluppo ha utilizzato anche una tecnica denominata Latent MoE, che migliora la precisione attivando quattro esperti al costo di uno per generare il token successivo durante l’inferenza.
Il colosso della tecnologia ha affermato che sta rilasciando il modello open supply con pesi aperti sotto una licenza permissiva. Per quanto riguarda il set di dati e la formazione, la società afferma che Nemotron 3 Tremendous è stato addestrato su dati sintetici generati utilizzando modelli di ragionamento di frontiera. Nvidia ha affermato che pubblicherà la metodologia completa, inclusi più di 10 trilioni di token o set di dati pre e post-formazione, 15 ambienti di formazione per l’apprendimento di rinforzo e ricette di valutazione.









