Segui ZDNET: Aggiungici come fonte preferita su Google.
I principali punti salienti di ZDNET
- GPT-5.4 mini funziona più del doppio della velocità di GPT-5 mini.
- Nuovi modelli mirano advert agenti, codifica e flussi di lavoro multimodali.
- Gli sviluppatori possono combinare modelli di pianificazione di grandi dimensioni con agenti secondari più economici.
Nelle ultime settimane, abbiamo visto la generazione dei modelli linguistici di punta di OpenAI passare da GPT-5.3 a GPT-5.4. Pensa al modello come al motore che alimenta il calcolo dell’intelligenza artificiale. Ogni salto generazionale si traduce solitamente in un aumento delle prestazioni e della precisione.
Inoltre: il nuovo GPT-5.4 di OpenAI ostacola gli esseri umani nel lavoro di livello professionale nei take a look at – dell’83%
Le versioni effettive possono essere un po’ difficili da monitorare senza una scorecard. Il 5 marzo OpenAI ha rilasciato GPT-5.4 Pondering, un modello di pensiero approfondito e advert alte prestazioni. Due giorni prima, esso rilasciato GPT-5.3 (non 5.4) Istantaneoun modello che “rende le conversazioni quotidiane più costantemente utili e fluide”, ma non necessariamente più correct.
Questa settimana OpenAI rilascia il file Modelli GPT-5.4 mini e GPT-5.4 nano. Questi modelli sono progettati per carichi di lavoro IA rapidi, efficienti e advert alto quantity. Queste sono fondamentalmente le offerte del modello linguistico economico.
Modelli più piccoli per flussi di lavoro AI
Per molti flussi di lavoro basati sull’intelligenza artificiale, il modello più efficace è quello che bilancia prestazioni elevate con risposte rapide e utilizzo affidabile degli strumenti.
Secondo OpenAI, “Questi modelli sono costruiti per i tipi di carichi di lavoro in cui la latenza modella direttamente l’esperienza del prodotto: assistenti di codifica che devono sentirsi reattivi, subagenti che completano rapidamente attività di supporto, sistemi che utilizzano pc che catturano e interpretano screenshot e applicazioni multimodali che possono ragionare sulle immagini in tempo reale.”
Inoltre: il “momento ChatGPT” di Nvidia per le auto a guida autonoma e altri annunci chiave sull’intelligenza artificiale al GTC 2026
L’azienda ha affermato: “In questi contesti, il modello migliore spesso non è quello più grande: è quello in grado di rispondere rapidamente, utilizzare gli strumenti in modo affidabile e comunque eseguire bene compiti professionali complessi”.
Rispetto a GPT-5 mini, GPT-5.4 mini migliora la codifica, il ragionamento, la comprensione multimodale e l’uso degli strumenti. Il modello funziona più del doppio della velocità del GPT-5 mini.
GPT-5.4 nano è il modello più piccolo e veloce, finalizzato alla classificazione, all’estrazione, al rating e advert attività più semplici di supporto alla codifica.
Miglioramenti delle prestazioni
Quando si considerano i modelli più piccoli e meno costosi, le prestazioni sono il fattore distintivo. Gli acquirenti vogliono sapere quanto stanno ottenendo in cambio. Per illustrare queste prestazioni, OpenAI sta mostrando vantaggi sostanziali rispetto ai modelli rilasciati pochi mesi prima:
- GPT-5.4 mini ottiene un punteggio del 54,38% su SWE-bench Professional rispetto al 45,69% di GPT-5 mini.
- Su Terminal-Bench 2.0, GPT-5.4 mini raggiunge il 60,00%, contro il 38,20% di GPT-5 mini.
- Su GPQA Diamond, GPT-5.4 mini ottiene un punteggio dell’88,01%, avvicinandosi al 93,00% di GPT-5.4.
- I risultati verificati da OSWorld mostrano che GPT-5.4 mini è al 72,13%, significativamente superiore al 42% di GPT-5 mini.
GPT-5.4 mini si avvicina alle velocità di passaggio del livello GPT-5.4 offrendo allo stesso tempo un’esecuzione più rapida. In altre parole, il modello mini GPT-5.4 più piccolo e leggero ha prestazioni quasi altrettanto buone del modello GPT-5.4 completo nei take a look at benchmark (i “tassi di superamento”) che misurano se il modello risolve correttamente i problemi.
Inoltre: perché i backup crittografati potrebbero fallire nell’period dei ransomware guidati dall’intelligenza artificiale
GPT-5.4 nano divide la differenza. Advert esempio, ottiene un punteggio del 52,39% su SWE-bench Professional e del 46,30% su Terminal Bench 2.0, non così alto come GPT-5.4 mini ma comunque notevolmente migliore di GPT-5 mini.
I take a look at effettuati dai clienti evidenziano i vantaggi
Specialista in tecnologia Hebbia crea strumenti che aiutano i professionisti a scavare attraverso enormi raccolte di documenti utilizzando il linguaggio naturale. Le loro offerte si rivolgono agli utenti di settori come la finanza, il diritto e la ricerca, dove la capacità di analizzare e ricavare approfondimenti da più documenti contemporaneamente è particolarmente utile.
Secondo Aabhas Sharma, CTO di Hebbia: “GPT-5.4 mini offre ottime prestazioni end-to-end per un modello di questa classe. Nelle nostre valutazioni, ha eguagliato o superato modelli della concorrenza in numerous attività di output e richiamo di citazioni a un costo molto inferiore. Ha anche raggiunto tassi di passaggio end-to-end più elevati e un’attribuzione della fonte più forte rispetto al modello GPT-5.4 più grande.”
Spazio di lavoro digitale Notion è il preferito degli esperti di produttività basati su Web. Sto scrivendo questo articolo nel mio spazio di lavoro Notion. La tecnologia fornisce una sede sia per i dati strutturati che per quelli non strutturati. Puoi anche utilizzare Notion per creare mini applicazioni senza codice per la gestione delle informazioni. Utilizzo Notion per tenere traccia della produzione dei miei articoli, dei progetti interni, dei piani video, dei progetti di sviluppo e altro ancora.
Inoltre: con la diffusione degli agenti IA, il nuovo strumento di 1Password affronta una crescente minaccia alla sicurezza
Abhisek Modi, responsabile dell’ingegneria AI presso Notion, ha dichiarato: “GPT-5.4 mini gestisce attività mirate e ben particular con una precisione impressionante. Per la modifica delle pagine in particolare, ha eguagliato e spesso superato GPT-5.2 nella gestione di formattazioni complesse con una frazione del calcolo.”
Modi ha continuato: “Fino a poco tempo fa, solo i modelli più costosi potevano gestire in modo affidabile le chiamate agli agentic instrument. Oggi, modelli più piccoli come GPT-5.4 mini e nano possono gestirlo facilmente, il che consentirà ai nostri utenti di creare agenti personalizzati su Notion per scegliere esattamente la quantità di intelligenza di cui hanno bisogno.”
Non sono rimasto molto impressionato dall’intelligenza artificiale di Notion. Si spera che, incorporando questi nuovi modelli, le prestazioni di Notion AI miglioreranno notevolmente.
Subagenti e compiti multimodali
Quando si inizia a osservare il modo in cui gli agenti si inseriscono nell’ecosistema complessivo, diventa evidente che l’intelligenza artificiale può essere strutturata per rispecchiare le operazioni umane nel mondo reale. Advert esempio, puoi combinare un modello AI più potente (come GPT-5.4 Pondering) con modelli più veloci ed economici come GPT-5.4 mini nello stesso modo in cui potresti avere un ingegnere senior che gestisce un workforce di ingegneri junior.
Inoltre: Nvidia vuole possedere il tuo knowledge heart AI da un capo all’altro
I sistemi advert agenti possono combinare modelli di dimensioni numerous, con modelli più grandi che pianificano attività e modelli più piccoli che eseguono attività secondarie. In questo contesto, GPT-5.4 mini può gestire il lavoro dei subagenti, come la ricerca di basi di codice, la revisione di file e l’elaborazione di documenti.
OpenAI ha affermato: “GPT-5.4 mini è efficace anche nelle attività multimodali, in particolare quelle relative all’uso del pc. Il modello può interpretare rapidamente schermate di interfacce utente dense per completare rapidamente le attività di utilizzo del pc.”
Disponibilità e prezzi
GPT-5.4 mini è disponibile nelle versioni API, Codex e ChatGPT. Per gli utenti dei livelli Free e Go, GPT-5.4 mini è accessibile tramite l’opzione “Pondering” nel menu Plus. OpenAI ha dichiarato: “Per tutti gli altri utenti, GPT-5.4 mini è disponibile come fallback con limite di velocità per GPT-5.4 Pondering”.
Inoltre: ho usato GPT-5.2-Codex per trovare un bug misterioso e un incubo di internet hosting: è stato velocissimo
La società ha affermato che per i programmatori, GPT-5.4 mini è disponibile attraverso l’app Codex, la CLI, l’estensione IDE e il net. OpenAI ha affermato che il modello mini “utilizza solo il 30% della quota GPT-5.4, consentendo agli sviluppatori di gestire rapidamente attività di codifica più semplici nel Codex per circa un terzo del costo”. Inoltre, Codex può anche delegare ai mini subagenti GPT-5.4 in modo che il lavoro meno intenso di ragionamento venga eseguito sul modello meno costoso.
Puoi vedere come si confrontano i costi quando li guardi fianco a fianco:
- Il prezzo mini di GPT-5.4 è di 0,75 dollari per milione di token di enter e 4,50 dollari per milione di token di output con una finestra di contesto di 400.000.
- GPT-5.4 nano è solo API e costa $ 0,20 per milione di token di enter e $ 1,25 per milione di token di output.
In confronto, GPT-5.4 ha un prezzo a $ 2,50 per milione di token di enter e $ 15,00 per milione di token di output. Questo è un quantità più costoso. È logico che se stai cercando di contenere i costi e non hai bisogno di potenza di elaborazione aggiuntiva, è meglio utilizzare i modelli mini e nano.
E tu?
Hai sperimentato modelli di intelligenza artificiale più piccoli, come GPT-5.4 mini o nano, nei tuoi flussi di lavoro? Preferisci utilizzare i modelli più grandi disponibili o ritieni che i modelli più veloci ed economici siano spesso “abbastanza buoni” per attività in tempo reale come codifica, analisi di documenti o flussi di lavoro degli agenti?
Se crei strumenti basati sull’intelligenza artificiale, come decidi quando utilizzare un modello di ragionamento completo rispetto a un modello di subagente leggero? Facci sapere cosa stai vedendo in pratica e commenta qui sotto.
Puoi seguire gli aggiornamenti quotidiani sui miei progetti sui social media. Assicurati di iscriverti a la mia newsletter di aggiornamento settimanalee seguimi su Twitter/X all’indirizzo @DavidGewirtzsu Fb all’indirizzo Facebook.com/DavidGewirtzsu Instagram all’indirizzo Instagram.com/DavidGewirtzsu Bluesky a @DavidGewirtz.come su YouTube all’indirizzo YouTube.com/DavidGewirtzTV.













