Home Tecnologia Microsoft rilascia nuovi modelli di intelligenza artificiale per espandersi ulteriormente oltre OpenAI

Microsoft rilascia nuovi modelli di intelligenza artificiale per espandersi ulteriormente oltre OpenAI

8
0

Mustafa Suleyman, CEO di Microsoft AI. (Foto del file GeekWire / Kevin Lisota)

Microsoft sta espandendo il proprio elenco di modelli di intelligenza artificiale interni, rilasciando un nuovo sistema di sintesi vocale e rendendo per la prima volta due modelli esistenti ampiamente disponibili agli sviluppatori.

Le mosse di Microsoft AI (MAI) fanno parte di uno sforzo più ampio da parte dell’azienda per espandere le proprie capacità proprietarie di intelligenza artificiale oltre la partnership con OpenAI, dando a Microsoft un maggiore controllo sul proprio destino nella competizione contro Google, Amazon e altri.

Microsoft annunciato MAI-Transcribe-1 di giovedì, un modello di sintesi vocale che afferma essere il più accurato attualmente disponibile. L’azienda ha inoltre rilasciato i suoi modelli esistenti di generazione di voce e immagini, noti come MAI-Voice-1 e MAI-Picture-2, per un ampio uso commerciale.

Si tratta del primo importante rilascio di un modello di Microsoft dalla riorganizzazione di marzo, annunciata dal CEO Satya Nadella, in cui il CEO di Microsoft AI Mustafa Suleyman si è spostato dalla supervisione quotidiana di Copilot per concentrarsi sullo sviluppo di modelli di frontiera e sulla superintelligenza.

Solimano ha detto a The Verge che il modello di trascrizione funziona a “metà del costo della GPU rispetto agli altri modelli all’avanguardia”. Lui ha detto a VentureBeat che il modello è stato costruito da un workforce di sole 10 persone e che Microsoft prevede di costruire eventualmente un modello linguistico di frontiera di grandi dimensioni che sia “completamente indipendente” se necessario.

Microsoft ha recentemente assunto l’ex Allen Institute come CEO Ali Farhadi e altri importanti ricercatori sull’intelligenza artificiale dell’istituto con sede a Seattle per rafforzare ulteriormente il workforce di Suleyman, come riportato da GeekWire la scorsa settimana.

MAI-Transcribe-1 è progettato per gestire condizioni reali rumorose come name heart e sale conferenze e Microsoft afferma che sta testando le integrazioni con Copilot e Groups. Microsoft afferma di offrire il miglior rapporto qualità-prezzo di qualsiasi grande fornitore di servizi cloud, competendo direttamente con Whisper di OpenAI e Gemini di Google sul benchmark FLEURS.

In un post sul blogSuleyman definì il modello “non solo il più preciso ma anche velocissimo”.

MAI-Voice-1 genera un parlato dal suono naturale e ora consente agli sviluppatori di creare voci personalizzate da brevi frammenti di audio campione. MAI-Picture-2 si colloca tra i primi tre nella classifica di generazione di immagini di Area.ai ed è disponibile in Bing e PowerPoint.

Tutti e tre sono disponibili sulla piattaforma AI per sviluppatori Microsoft Foundry e MAI Playground.

fonte

LEAVE A REPLY

Please enter your comment!
Please enter your name here