Giovedì, Anthropic ha lanciato Claude Opus 4.8, la versione più recente e avanzata del suo modello AI di punta. È disponibile ovunque allo stesso prezzo del suo predecessore, Opus 4.7 (5 dollari per milione di token di enter e 25 dollari per milione di token di output).
Opus 4.8 vanta punteggi chief del settore in attività come la codifica advert agenti e l’uso del pc advert agenti, che è la norma per un nuovo modello antropico. L’elemento chiave di differenziazione sottolineato dall’azienda è l’onestà del modello e, per estensione, la sua affidabilità complessiva.
Secondo una società articolo del blogOpus 4.8 è specializzato nel cogliere i propri errori e segnalarli agli utenti: “un problema generale con i modelli di intelligenza artificiale è che a volte saltano alle conclusioni, affermando con sicurezza di aver fatto progressi nel loro lavoro nonostante le show siano scarse”, ha scritto l’azienda. “I primi tester riferiscono che Opus 4.8 ha maggiori probabilità di segnalare incertezze sul suo lavoro e meno probabilità di fare affermazioni non supportate.”
Advert esempio, Michael Ran, un socio senior degli investimenti presso la società di gestione patrimoniale Bridgewater, è stato citato nel submit sul weblog di Anthropic affermando che Opus 4.8 period in grado di “segnalare in modo proattivo i problemi con gli enter e gli output di un’analisi, qualcosa che altri modelli normalmente trascurano e lasciano agli utenti il compito di rilevare.”
Secondo il modello, l’Opus 4.8 presenta anche un rischio “sostanzialmente inferiore” di comportamenti disallineati e pericolosi, inclusa la generazione di contenuti sessuali dannosi e il “minare la democrazia liberale”. scheda di sistema.
Flussi di lavoro dinamici e controllo dello sforzo
Oltre al nuovo modello, Anthropic ha anche annunciato il lancio di “flussi di lavoro dinamici”, una nuova funzionalità ora disponibile come anteprima della ricerca, che consente a Claude di gestire attività di codifica più complesse distribuendo centinaia di subagenti che possono lavorare in parallelo tra loro.
Gli utenti possono aspettarsi un notevole miglioramento da Opus 4.8, soprattutto per attività di codifica più grandi, ma non è un punto di svolta. Anthropic ha anche cercato di coprire le aspettative, scrivendo nel suo nuovo submit sul weblog che Opus 4.8 è “un miglioramento modesto ma tangibile rispetto al suo predecessore”, Opus 4.7. Quel modello ha debuttato poco più di un mese fa e ha ricevuto una tiepida risposta da parte degli utenti, alcuni dei quali si sono lamentati del fatto che la sua funzionalità di “pensiero adattivo” a volte gli faceva dedicare troppo tempo advert attività che avrebbero dovuto essere facili e veloci, e non abbastanza tempo advert attività che meritano più impegno.
Forse in risposta diretta a story reclamo, Anthropic ha anche annunciato giovedì il lancio di un nuovo pannello di “controllo dello sforzo” (che si trova nel menu a discesa del selettore del modello) per Claude, che ti consente di scegliere manualmente la quantità di impegno – e i gettoni – che desideri spendere per una determinata attività. È impostato su “Basso” per impostazione predefinita e puoi cambiarlo su “Medio”, “Alto” e “Massimo” o attivare la modalità di pensiero adattivo.
“Modelli di classe Mythos”
Anthropic ha anche anticipato l’imminente debutto di “una nuova classe di modelli” con capacità presumibilmente alla pari con quelle di Mitiil modello misterioso che sta mandando brividi freddi lungo la schiena della Silicon Valley. La società deve ancora rendere pubblico il modello, citando la potenza senza precedenti del modello e i suoi rischi per la sicurezza informatica.
Secondo il suo nuovo submit sul weblog, Anthropic sta attualmente lavorando per testare le misure di sicurezza per Mythos e prevede di rilasciare “modelli di classe Mythos per tutti i nostri clienti nelle prossime settimane”.
Ovviamente è estremamente vago, probabilmente intenzionalmente così. Il tempo dirà se questi nuovi modelli saranno all’altezza delle prime voci rivoluzionarie che circolavano attorno a Mythos, o se (più probabilmente) la nuova categoria di modelli è una versione sostanzialmente annacquata del colosso originale. Gli sviluppatori di intelligenza artificiale, dopo tutto, tendono a esaltare le abilità e i pericoli dei propri modelli prima che vengano rilasciati e, nella maggior parte dei casi, la realtà non soddisfa del tutto le aspettative. (Ricordate tutta l’eccitazione per il fatto che GPT-5 fosse AGI?) Poi ancora, forse Anthropic è effettivamente pronto a scatenare modelli sconvolgenti che erano considerati una minaccia esistenziale alla sicurezza globale solo un paio di mesi fa. Il tempo lo dirà e riferiremo non appena ne sapremo di più.













