L’attuale ondata di animazione IA generativa spesso sembra un trucco magico che funziona solo una volta. Digiti un messaggio, viene visualizzato un video e se non ti piace il risultato (forse i piedi sono tutti traballanti, il che è un problema normale con le generazioni di intelligenza artificiale) l’unica vera opzione è provare un messaggio diverso. Questo approccio da “scatola nera” è esattamente ciò che Cartwheel, una nuova startup di animazione 3D, sta cercando di smantellare.
Andrew Carr e Jonathan Jarvis, due veterani con radici rispettivamente in OpenAI e Google, hanno fondato l’azienda, che sta lavorando per costruire un futuro in cui l’intelligenza artificiale gestisca il lavoro tecnico dell’animazione lasciando l’anima creativa all’artista.
Ho parlato con Carr e Jarvis del lancio della loro azienda, della definizione del “gusto” con l’intelligenza artificiale e delle difficoltà tecniche e artistic dell’animazione nel 2026.
Ciò che distingue Cartwheel
Secondo i fondatori, uno dei maggiori ostacoli in questo ambito è che i dati di movimento 3D sono notevolmente scarsi rispetto agli infiniti oceani di testo e immagini disponibili on-line su cui vengono addestrati i modelli di intelligenza artificiale.
“Se guardi a tutte le grandi aziende tecnologiche, hanno costruito i loro modelli sul linguaggio scritto, sull’audio, sulle immagini, [and] video perché ce n’è così tanto, quindi trovare questi modelli è molto più semplice”, ha detto Jarvis. “Sapevamo che sarebbe stato difficile, ma si è rivelato essere più difficile di quanto pensassimo, probabilmente con un fattore di 10 o 100, per ottenere quei dati.”
Per saperne di più: L’intelligenza artificiale generativa nel gaming è qui, ma deve affrontare le resistenze dei giocatori e degli sviluppatori
Mentre altri giganti della tecnologia si concentrano sulla generazione dei pixel finali, Cartwheel ha trascorso anni a mappare il modo in cui gli esseri umani si muovono effettivamente. I loro modelli sono costruiti per comprendere le sfumature di una efficiency in modo che un semplice video 2D di qualcuno che balla nel proprio cortile possa essere tradotto in uno scheletro 3D preciso e realistico.
Questo passaggio dalle immagini piatte alle risorse 3D è ciò che offre agli animatori il controllo che è mancato nell’period dell’intelligenza artificiale.
Cartwheel ha trascorso anni affrontando il difficile compito di mappare il modo in cui gli esseri umani si muovono effettivamente.
Prevenire l'”identità” dell’IA
I dirigenti di Cartwheel hanno affermato di considerare l’“identità” dell’intelligenza artificiale come un sottoprodotto di una mancanza di controllo. Se tutti utilizzassero lo stesso generatore per produrre un video, i risultati potrebbero alla high quality iniziare a sembrare fin troppo simili.
“L’output del nostro sistema è progettato per essere modificato dalle persone. È progettato per essere toccato e manipolato dalle persone, e non vogliamo che qualcuno digiti qualcosa e poi lo passi fino a un’animazione finita. Non è questo il punto. È noioso, chi lo guarderà?” Ha detto Carré.
“Il fatto che sia molto facile per le persone accedervi e modificarlo in realtà rimuove totalmente il problema dell’identità”, ha detto. “Lo metti su personaggi diversi, lo metti in ambienti diversi, cambi il suo aspetto, spingi la efficiency, spingi la efficiency, e in questo senso [sameness] diventa un non-problema.”
Carr e Jarvis affermano che la soluzione è fornire un “livello di controllo” in cui l’output dell’intelligenza artificiale sia solo il punto di partenza. Generando dati 3D invece di video piatti, il creatore può cambiare l’illuminazione, spostare la telecamera o regolare la posa di un personaggio dopo che l’intelligenza artificiale ha svolto il suo lavoro iniziale, rendendo la tecnologia uno strumento sofisticato piuttosto che un sostituto dell’artista.
Il fondatore Andrew Carr ha affermato che una delle sue ipotesi scientifiche fondamentali è che il movimento è un tipo di dati fondamentale.
Il futuro dell’animazione con l’intelligenza artificiale
Oltre a rendere l’animazione più veloce e advert abbassare le barriere all’ingresso, l’azienda sta guardando a un concetto che chiamano “narrativa a tempo indeterminato” o “costruzione di mondi a tempo indeterminato”. Nei giochi moderni e nei social media, la domanda di contenuti ha raggiunto una scala che l’animazione manuale non può assolutamente eguagliare.
Cartwheel immagina personaggi che non sono solo programmati con poche mosse prestabilite, ma sono alimentati da modelli di movimento che consentono loro di reagire ed esibirsi in tempo reale. Si tratta meno di coreografare ogni singolo fotogramma e più di “provare” con un attore digitale che comprende l’intento della scena.
In definitiva, l’obiettivo è colmare il divario tra visione 2D ed esecuzione 3D, hanno affermato i fondatori.
“Una delle ipotesi principali che speriamo sia vera nei prossimi tre anni per Cartwheel è che tutti lavoreranno in 3D anche se saranno scritti in 2D, anche se l’output finale sarà solo video 2D”, ha detto Carr.
Concentrandosi sullo “strato sotto i pixel”, Carr e Jarvis sperano che, man mano che l’animazione diventa più automatizzata, diventi anche più personale. La macchina gestisce la biomeccanica e l’esportazione dei file, ma l’uomo ha l’ultima parola sul gusto, sui tempi e sul cuore della storia.









