L’intelligenza artificiale in grado di “ragionare” è ora in grado di diagnosticare scenari medici della vita reale altrettanto bene o meglio dei medici, secondo risultati di uno studio pubblicato giovedì in Scienza.
I ricercatori hanno utilizzato casi clinici precedentemente sconosciuti per testare il modello di ragionamento o1 di OpenAI rispetto al modello precedente dell’azienda, GPT-4, nonché con medici e specializzandi in formazione.
In una serie di esperimenti, il modello o1 ha spesso migliorato significativamente la capacità diagnostica di GPT-4 e ha anche superato i medici. Quando testato con le cartelle cliniche elettroniche di casi casuali del pronto soccorso di un ospedale di Boston, il modello o1 si è rivelato accurato dal punto di vista diagnostico per più di due terzi delle volte al triage iniziale. Due medici curanti esperti avevano diagnosi corrette circa la metà delle volte.
Cosa può dirti l’intelligenza artificiale riguardo al tuo esame del sangue
Il dottor Robert Wachter, professore e presidente del Dipartimento di Medicina dell’Università della California, a San Francisco, ha descritto i risultati dello studio come “importanti” e ha suggerito che è ormai “indiscutibile” che l’intelligenza artificiale moderna supererà i vecchi modelli linguistici e i medici quando verrà loro chiesto di identificare la diagnosi giusta e il passo successivo. Non è stato coinvolto nello studio.
Tuttavia, Wachter, autore di “Un passo da gigante: come l’intelligenza artificiale sta trasformando l’assistenza sanitaria e cosa significa per il nostro futuro,” ha aggiunto che sono necessarie ulteriori ricerche prima che l’IA venga pienamente implementata nella pratica clinica.
Velocità della luce mashable
“La domanda è quanto questo riproduce fedelmente la vita reale, e la risposta è moderatamente buona ma non perfetta”, ha scritto Wachter in una e-mail.
Come riconoscono gli autori dello studio, gli esperimenti erano limitati a enter di solo testo e non includevano indizi e segnali visivi e uditivi su cui spesso i medici fanno affidamento per la diagnosi. Questi possono includere il livello di disagio del paziente e l’imaging medico.
“GenAI può probabilmente iniziare a integrare questi enter, ma per ora, testare uno situation clinico scritto e spesso artificialmente ‘pulito’ non è la stessa cosa che entrare in un pronto soccorso e affrontare il caos”, ha affermato Wachter. “Basta guardare Il Pitt.”
Quando uscirà la terza stagione di “The Pitt”?
Sulla base dei loro risultati, gli autori dello studio hanno evidenziato la necessità “urgente” di ulteriori studi e sperimentazioni cliniche prospettiche per determinare come i sistemi di intelligenza artificiale possano migliorare la pratica clinica e i risultati dei pazienti.
“Il rapido ritmo di miglioramento degli LLM ha implicazioni sostanziali per la scienza e la pratica della medicina clinica”, hanno scritto gli autori, molti dei quali lavorano presso il Beth Israel Deaconess Medical Middle di Boston, dove è stato condotto lo studio.
UN articolo allegatopubblicato anche in Scienza e scritto da due esperti del Flinders Well being and Medical Analysis Institute di Adelaide, in Australia, che non sono stati coinvolti nello studio, concordano con le sue implicazioni urgenti. Si sono inoltre opposti alla sostituzione dei medici con l’intelligenza artificiale, prevedendo invece uno stile di collaborazione che offra supervisione, giudizio contestuale e responsabilità.
“Senza una solida efficacia dimostrata, equità e sicurezza, molti sistemi di intelligenza artificiale rimarranno insufficienti per l’uso clinico”, hanno scritto gli esperti.











