Home Tecnologia La società cinese di intelligenza artificiale SenseTime pubblica un modello di immagine...

La società cinese di intelligenza artificiale SenseTime pubblica un modello di immagine creato per la velocità

10
0

SenseTime, un cinese La società di intelligenza artificiale meglio conosciuta per la sua tecnologia di riconoscimento facciale, ha rilasciato martedì un nuovo modello open supply che afferma di poter generare e interpretare immagini molto più velocemente rispetto ai modelli di punta sviluppati dai concorrenti statunitensi. SenseNova U1 potrebbe aiutare l’azienda a recuperare il terreno perduto dopo essere scivolata dal suo posto tra i principali attori nella corsa allo sviluppo dell’intelligenza artificiale in Cina.

La salsa segreta del modello è la sua capacità di “leggere” le immagini senza prima tradurle in testo, accelerando il processo e riducendo la quantità di potenza di calcolo richiesta. “L’intero processo di ragionamento del modello non è più limitato al testo. Può ragionare anche con le immagini”, ha detto Dahua Lin, cofondatore e capo scienziato di SenseTime, in un’intervista a WIRED.

Lin, che è anche professore di ingegneria dell’informazione presso l’Università cinese di Hong Kong, afferma che i modelli in grado di elaborare direttamente le immagini consentiranno ai robotic di comprendere meglio il mondo fisico in futuro.

Come l’ultimo modello di punta di DeepSeek, SenseTime afferma che l’U1 può essere alimentato da chip di fabbricazione cinese. “Diversi produttori di chip nazionali cinesi hanno finito di ottimizzare la compatibilità con il nostro nuovo modello”, afferma Lin. Il giorno del rilascio, 10 progettisti di chip cinesi, tra cui Cambricon e Biren Know-how, hanno annunciato che il loro {hardware} supporta U1.

Questa flessibilità è importante perché i controlli sulle esportazioni statunitensi impediscono alle aziende cinesi di accedere ai chip di intelligenza artificiale più avanzati del mondo, in particolare a quelli utilizzati per la formazione, che al momento sono sviluppati principalmente da aziende occidentali come Nvidia. “Continueremo a spingere per la formazione su chip sempre più diversi”, afferma Lin. Ma riconosce anche che SenseTime “potrebbe comunque aver bisogno di utilizzare i migliori chip per garantire la velocità della nostra iterazione”.

SenseTime ha rilasciato U1 gratuitamente su Hugging Face e GitHub, un altro segno di come le aziende cinesi stiano diventando tra i contributori più attivi all’intelligenza artificiale open supply.

SenseTime è stata fondata nel 2014 ed è diventata chief mondiale nella visione artificiale, utilizzata in applicazioni come il riconoscimento facciale e la guida autonoma. Ma quando ChatGPT e altri sistemi di intelligenza artificiale basati sull’elaborazione del linguaggio naturale sono diventati la cosa più interessante nel settore tecnologico, SenseTime ha iniziato a faticare a realizzare un profitto ed è rimasta indietro rispetto alle nuove startup cinesi come DeepSeek e MiniMax.

SenseTime afferma che spera che il rilascio pubblico di SenseNova-U1 affinché chiunque possa utilizzarlo lo aiuterà a mettersi al passo con i giocatori di intelligenza artificiale nazionali e occidentali. Lin afferma che l’anno scorso l’azienda ha finalmente deciso di concentrarsi sull’open supply grazie all’utile suggestions ricevuto dai ricercatori, che consente all’azienda di iterare più rapidamente. “Al giorno d’oggi, essere open supply o closed supply non è il fattore vincente; lo è la velocità di iterazione”, spiega Lin.

Il passaggio all’open supply aiuta inoltre SenseTime a continuare a collaborare con ricercatori internazionali senza l’interferenza della geopolitica. La società è stata ripetutamente sanzionata dal governo degli Stati Uniti negli ultimi anni con l’accusa secondo cui la sua tecnologia di riconoscimento facciale avrebbe aiutato a potenziare i sistemi di sorveglianza utilizzati per monitorare e detenere gli uiguri e altri gruppi minoritari nella regione cinese dello Xinjiang. Di conseguenza, alle aziende statunitensi non è consentito investire in SenseTime e vendergli determinate tecnologie senza licenza. (SenseTime ha negato le accuse.)

Un’immagine di esempio creata utilizzando SenseNova U1. Generato utilizzando l’intelligenza artificiale

Per gentile concessione di SenseTime

Vedere chiaramente

In un rapporto tecnico di accompagnamento, SenseTime afferma che SenseNova-U1 genera immagini di qualità superiore rispetto a tutti gli altri modelli open supply attualmente sul mercato. Le sue prestazioni sono paragonabili a quelle dei principali modelli closed supply cinesi come Qwen di Alibaba e Seedream di ByteDance, ma è ancora in ritardo rispetto a pacesetter del settore come GPT-Picture-2.0, uscito solo una settimana fa.

Ma il principale punto di forza del modello è la sua capacità di generare immagini molto più velocemente di tutti questi modelli. Si basa su una struttura tecnica innovativa chiamata NEO-Unify che SenseTime ha presentato in anteprima all’inizio di quest’anno.

fonte

LEAVE A REPLY

Please enter your comment!
Please enter your name here