Home Tecnologia DeepSeek presenta in anteprima un nuovo modello di intelligenza artificiale che “colma...

DeepSeek presenta in anteprima un nuovo modello di intelligenza artificiale che “colma il divario” con i modelli di frontiera

11
0

Il laboratorio cinese di intelligenza artificiale DeepSeek ha lanciato due versioni di anteprima del suo nuovo modello linguistico di grandi dimensioni, DeepSeek V4un aggiornamento molto atteso del modello V3.2 dello scorso anno e del modello di ragionamento R1 che lo ha accompagnato, che ha preso d’assalto il mondo dell’intelligenza artificiale.

L’azienda afferma che sia DeepSeek V4 Flash che V4 Professional sono modelli misti di esperti con finestre di contesto di 1 milione di token ciascuna, sufficienti per consentire l’utilizzo di codebase o documenti di grandi dimensioni nei immediate. L’approccio misto di esperti prevede l’attivazione solo di un certo numero di parametri per attività per ridurre i costi di inferenza.

Il modello Professional ha un totale di 1,6 trilioni di parametri (49 miliardi attivi), il che lo rende il più grande modello open-weight disponibile, superando Kimi Okay 2.6 di Moonshot AI (1,1 trilioni), M1 di MiniMax (456 miliardi) e più del doppio di DeepSeek V3.2 (671 miliardi). La più piccola, V4 Flash, ha 284 miliardi di parametri (13 miliardi attivi).

DeepSeek afferma che entrambi i modelli sono più efficienti e performanti di DeepSeek V3.2 grazie ai miglioramenti dell’architettura e hanno quasi “colmato il divario” con gli attuali modelli chief, sia aperti che chiusi, sui benchmark di ragionamento.

L’azienda afferma che il suo nuovo modello V4-Professional-Max supera i suoi colleghi open supply in termini di benchmark di ragionamento e supera GPT-5.2 e Gemini 3.0 Professional di OpenAI in alcune attività. Nella codifica dei benchmark della concorrenza, DeepSeek ha affermato che le prestazioni di entrambi i modelli V4 sono “paragonabili a GPT-5.4”.

Tuttavia, i modelli sembrano rimanere leggermente indietro rispetto ai modelli di frontiera nei take a look at di conoscenza, in particolare GPT-5.4 di OpenAI e l’ultimo Gemini 3.1 Professional di Google. Questo ritardo suggerisce una “traiettoria di sviluppo che segue i modelli di frontiera più avanzati di circa 3-6 mesi”, ha scritto il laboratorio.

Sia V4 Flash che V4 Professional supportano solo testo, a differenza di molti dei suoi peer closed supply, che offrono supporto per la comprensione e la generazione di audio, video e immagini.

Evento Techcrunch

San Francisco, California
|
13-15 ottobre 2026

In particolare, DeepSeek V4 è molto più conveniente di qualsiasi modello di frontiera oggi disponibile. Il modello Flash V4 più piccolo costa 0,14 dollari per milione di token di enter e 0,28 dollari per milione di token di output, sottoquotando GPT-5.4 Nano, Gemini 3.1 Flash, GPT-5.4 Mini e Claude Haiku 4.5. Il modello più grande V4 Professional, nel frattempo, costa $ 0,145 per milione di token di enter e $ 3,48 per milione di token di output, sottoquotando anche Gemini 3.1 Professional, GPT-5.5, Claude Opus 4.7 e GPT-5.4.

Il lancio arriva un giorno dopo quello degli Stati Uniti accusato La Cina ha rubato la proprietà intellettuale dei laboratori americani di intelligenza artificiale su scala industriale utilizzando migliaia di account proxy. La stessa DeepSeek è stata accusata da Anthropic e OpenAI di “distillare”, essenzialmente copiare, i loro modelli di intelligenza artificiale.

Quando acquisti tramite i hyperlink presenti nei nostri articoli, potremmo guadagnare una piccola commissione. Ciò non pregiudica la nostra indipendenza editoriale.

fonte

LEAVE A REPLY

Please enter your comment!
Please enter your name here