Anthropic non è ancora pronto a consentire agli utenti abituali di dare un’occhiata al suo modello AI Claude Mythos apparentemente tremendous potente. Ma la società di intelligenza artificiale ha appena rilasciato un aggiornamento per il suo prodotto di punta, Claude Opus, ora nella versione 4.8.
“Si basa su Opus 4.7 con miglioramenti rispetto ai benchmark ed è un collaboratore più efficace”, Anthropic promesso in un comunicato stampa Giovedì. In effetti, i numeri di riferimento riportati di seguito mostrano miglioramenti molto minori su tutta la linea.
Un miglioramento importante, presumibilmente, riguarda l’space delle allucinazioni. Claude Opus 4.8 non mentirà tanto agli utenti. “I primi tester riferiscono che Opus 4.8 ha maggiori probabilità di segnalare incertezze sul suo lavoro e meno probabilità di fare affermazioni non supportate”, ha detto Anthropic, pubblicizzando “l’onestà” del modello.
Claude Opus 4.8 ha un “giudizio migliore”
“Claude Opus 4.8 ha una capacità di giudizio notevolmente migliore”, ha detto advert Anthropic un ingegnere di Shopify, Tom Pritchard. La versione codificata del modello “pone le domande giuste, individua i propri errori e si oppone quando un piano non è valido”.
Dato il numero crescente di storie dell’orrore sugli agenti dell’intelligenza artificiale che cancellano interi database aziendali, quella promessa potrebbe essere musica per le orecchie dei programmatori di vibrazioni ovunque.
Velocità della luce mashable
Per soddisfare gli utenti esperti, Anthropic offre uno sconto significativo sulla “modalità veloce”, in cui Claude lavorerà a 2,5 volte la velocità normale. La modalità veloce “è ora tre volte più economica rispetto ai modelli precedenti”, ha affermato l’azienda.
Gli utenti su Reddit non lo compravanoTuttavia. Molti temevano la perdita dell’accesso a un modello più popolare, Claude Opus 4.6. “Nessuno si fida delle classifiche di riferimento”, ha scritto in sintesi un redditor, sottolineando che anche Opus 4.7 sembrava avere dei numeri piuttosto buoni quando è stato rilasciato.
Che ci si possa fidare o meno dei benchmark – e per essere chiari, Mashable non ha verificato in modo indipendente questi numeri – ecco cosa sostiene Anthropic.
Credito: antropico
Come provare Claude Opus 4.8
Claude Opus 4.8 è ora disponibile tramite il sito Net di Anthropic, Claude.AInonché tramite l’API Claude, oltre a accomplice Anthropic come Microsoft Foundry.
Il nuovo modello è prezzo esattamente lo stesso come i suoi predecessori, vale a dire modelli che risalgono fino a Claude Opus 4.5. Tutti ti costeranno $ 5 per milione di token di enter e $ 25 per milione di token di output.
Dato che Anthropic promette Claude Mythos nel giro di poche settimane, tuttavia, potresti voler restare indietro e aspettare di vedere se quel modello può essere ancora più “onesto” riguardo alle sue allucinazioni.
Argomenti
Intelligenza Artificiale Antropica











