Apple ci ha promesso una Siri più intelligente e più capace alla WWDC 2024. La presentazione period avvincente: una Siri che comprende il tuo contesto personale, analizza i tuoi messaggi e le tue e-mail, esegue azioni all’interno delle tue app e si evolve in un vero assistente.
Due anni dopo, quel sogno rimane ancora un sogno. Ma ecco la cosa che potrebbe cambiare il corso dell’assistente di Apple. Secondo i rapporti, Siri non è più legata a un singolo cervello AI. Apple lo sta costruendo per essere flessibile, in grado di instradare le richieste a qualunque modello esterno svolga meglio il lavoro.
Questo mi ha fatto porre una domanda. Se Siri può utilizzare qualsiasi intelligenza artificiale, quale dovrebbe utilizzare? Al momento, il modello esterno predefinito è ChatGPT. Ma direi che i Gemelli sono la scelta più logica, ed ecco perché.
Siri è un motore di ricerca
Pensa a come usi effettivamente Siri ogni giorno. Chiedi il tempo della giornata. Chiedi i ristoranti più vicini vicino a te. Gli chiedi di cercare cose sul net. Una parte significativa dell’utilizzo di Siri riguarda la ricerca o question simili alla ricerca, e nessuna azienda al mondo esegue ricerche meglio di Google.
Google ha impiegato decenni per costruire il motore di ricerca più potente e questa esperienza ora confluisce direttamente in Gemini. Quando chiedi qualcosa ai Gemelli, non si basa solo su un modello linguistico. Estrae i dati dall’indice net in tempo reale di Google, Google Maps, Google Procuring e altro ancora.

Usarlo per potenziare la capacità di ricerca di Siri lo porterà a nuovi livelli che nessun altro fornitore LLM può eguagliare.
Apple ha promesso intelligenza personale, ma Gemini la sta offrendo
Uno dei maggiori punti di discussione dell’annuncio di Apple al WWDC 2024 è stata l’intelligenza personale. Apple ha mostrato a Siri di far emergere informazioni contestuali da tutte le tue app, rispondendo a domande come “quando atterrerà il volo di mia madre?” oppure “mostrami le foto di Stacy con il suo cappotto rosa di New York”.

È stato davvero impressionante in forma demo. Tuttavia, se gli chiedo di mostrarmi una foto di me che indosso una maglietta nera, mostrerà foto casuali di persone dal net che indossano magliette nere. Non esagero quando dico che la funzione di intelligenza personale di Siri è stata un fallimento colossale.

Nel frattempo, Gemini ha lanciato silenziosamente la propria funzionalità di Intelligenza Personale. Attinge a Gmail, Calendario, Google Foto, Drive e altro ancora per ragionare sui tuoi dati personali e rispondere a domande complesse sul contesto della vita. Non è perfetto, ma almeno funziona.

Questo è quasi parola per parola ciò che Apple stava dimostrando come futura funzionalità di Siri, tranne che Gemini lo sta facendo oggi. Se Apple vuole accelerare la fornitura di tali funzionalità agli utenti, Gemini potrebbe essere la scorciatoia di cui hanno bisogno.
I Gemelli fanno già ciò che Siri ha promesso
Apple Intelligence distribuisce un modello di intelligenza artificiale compatto e capace in tutte le app di sistema, combinando l’elaborazione sul dispositivo per la privateness con il cloud computing per attività più impegnative. L’elaborazione sul dispositivo e gli aspetti relativi alla privateness sono ciò che distingue Apple dalla concorrenza. Ma non è solo adesso.

Gemini Nano lo sta già facendo sui dispositivi Pixel e Samsung Galaxy. Supporta riepiloghi offline, risposte intelligenti e funzionalità contestuali, il tutto senza bisogno di una connessione Web. Su Pixel 9 e successivi Gemini Nano è multimodale e può elaborare immagini, testi e lingue direttamente sul dispositivo.

Apple sta sviluppando ciò che Google ha già fornito. Piuttosto che reinventare quella ruota, utilizzare l’implementazione Nano esistente di Gemini come base per le funzionalità Siri sul dispositivo farebbe risparmiare advert Apple un sacco di mal di testa e denaro.
Il package di strumenti creativi di Gemini è ricco
È qui che la cosa diventa davvero emozionante. I Gemelli non sono solo un modello testuale. Viene fornito con un intero ecosistema creativo a cui Apple potrebbe attingere.
Veo gestisce la generazione di video fino a 1080p, con stili cinematografici e clip più lunghi di un minuto. Lyria, di Google DeepMind, gestisce la generazione di musica e audio. Per le immagini, Nano Banana (il servizio di generazione di immagini di Google) ha recentemente ricevuto un importante aggiornamento, con rendering del testo migliorato, coerenza del soggetto e supporto per qualsiasi proporzione.

Apple ha recentemente lanciato il proprio Creator Studio, offrendo agli utenti l’accesso a strumenti creativi per un abbonamento mensile fisso. Se l’azienda intende seriamente competere con aziende del calibro di Adobe, deve offrire capacità generative. Indovina un po’, Gemini ha già tutte queste funzionalità e avrebbe perfettamente senso integrarlo nella suite creativa di Apple.

Il partenariato esiste già
Questo punto non è abbastanza discusso. Secondo quanto riferito, Google paga advert Apple circa 20 miliardi di dollari ogni anno per rimanere il motore di ricerca predefinito in Safari. Questo è uno degli accordi di distribuzione più preziosi nella storia della tecnologia. Il rapporto tra Apple e Google è profondo, di lunga knowledge e finanziariamente enorme per entrambe le società.
Estendere questa relazione da “Google potenzia la ricerca Safari” a “Gemini potenzia le funzionalità AI di Siri” non è un passo drammatico. È la naturale evoluzione di una partnership che gestisce la metà di ciò che accade quando apri un browser sul tuo iPhone.
Quindi quale modello resterei?
Claude è eccellente per la lettura di un contesto lungo e per il ragionamento sfumato. ChatGPT ha un ecosistema enorme e forti strumenti di codifica e agente. Entrambi funzionano alla grande come specialisti scelti dall’utente. Io stesso uso Claude sul mio laptop.
Ma qual è il motore predefinito sotto il cofano di Siri? Non sono la scelta giusta. Gemini opera a livello di sistema operativo su dispositivi mobili, comprende ricerche e contesti personali, esiste in un fattore di forma Nano sul dispositivo e si trova al centro del rapporto commerciale più importante che Apple ha con qualsiasi azienda tecnologica.
I pezzi ci sono tutti. La questione non è se Gemini possa alimentare una Siri più intelligente. La questione è se Google e Apple riusciranno a concludere un accordo reciprocamente vantaggioso. E a giudicare dalle indiscrezioni, le cose potrebbero già andare in questa direzione.












