Home Tecnologia Gli appunti delle riunioni AI di Talat rimangono sul tuo laptop, non...

Gli appunti delle riunioni AI di Talat rimangono sul tuo laptop, non nel cloud

6
0

L’app per appunti Granola, basata sull’intelligenza artificiale, valutata 250 milioni di dollari, è diventata uno strumento popolare tra i fondatori del settore tecnologico e i VC. Ma uno sviluppatore ritiene che ci sia richiesta per un’alternativa più privata, esclusivamente locale, disponibile con una tariffa una tantum e senza abbonamento. Ciò ha portato alla creazione di una nuova app per Mac chiamata Talat.

Sviluppatore con sede nello Yorkshire, Inghilterra Nick Payneun sedicente nerd del laptop, afferma che l’thought di costruire un notetaker locale con intelligenza artificiale è nata principalmente a causa di una serie di felici incidenti.

“Penso che Granola sia fantastico; è un brillante esempio di cosa puoi fare con un’app Electron [a framework for building desktop applications] dato abbastanza amore e cura “, ha detto a TechCrunch. “Quando l’ho provato per la prima volta, sono rimasto affascinato dal fatto che riuscisse a registrare l’audio di sistema sul mio Mac senza registrare video, che period la soluzione alternativa normal all’epoca. Ciò ha portato a tantissime ricerche, alla scoperta di un’API Apple relativamente nuova e scarsamente documentata”.

Per semplificare il lavoro con quell’API (Core Audio Faucets, che consente agli sviluppatori di accedere ai flussi audio di un Mac), Payne ha deciso di creare una libreria audio open supply, AudioTee.

“Durante quel periodo, stavo lentamente mettendo insieme un package di strumenti, ma non ho mai trovato nulla che potesse reggere da solo come prodotto piuttosto che come semplice demo tecnologica”, ha detto Payne. “I modelli di trascrizione ospitati all’avanguardia – gli stessi fornitori utilizzati da Granola – sono incredibili, ed è visceralmente bello vedere il tuo discorso svolgersi sullo schermo quasi in tempo reale. Ma mi ha sempre tormentato il fatto che il compromesso richiedesse di fornire non solo i miei dati, ma anche i miei dati audio; la mia vera voce”, ha aggiunto.

Poi si è imbattuto in un package di strumenti software program chiamato FluidAudioun framework Swift che abilita l’intelligenza artificiale audio completamente locale e a bassa latenza sui dispositivi Apple. Ti consente di eseguire modelli di trascrizione piccoli e veloci direttamente sul Neural Engine del Mac, l'{hardware} dedicato di Apple per l’elaborazione AI.

Questo è stato l’articolo che ha fatto capire a Payne che avrebbe potuto trasformare la sua ricerca in un prodotto reale, in cui l’audio non lascia mai il tuo Mac e le tue trascrizioni non vengono archiviate sui server di un’altra azienda.

Talatche period costruito accanto L’amico di lunga knowledge ed ex collega di Payne, Mike Franklin, è il risultato dell’interesse di Payne per lo spazio audio. Il risultato è un acquisto una tantum di 20 MB che non richiede la creazione di un account o la condivisione dei dati analitici con gli sviluppatori. Non ci sono nemmeno commissioni correnti.

Mentre alcuni notetaker AI possono avere più campanelli e fischietti, Talat offre una serie di funzionalità semplificate. Cattura l’audio dal microfono del tuo laptop quando utilizzi app per riunioni come Zoom, Groups, Meet e altre e lo trascrive in tempo reale. L’app tenta di assegnare i relatori in tempo reale, ma puoi riassegnarli secondo necessità. Puoi anche prendere appunti e modificare, eliminare o dividere segmenti di trascrizione. Al termine della riunione, un LLM locale genera un riepilogo con punti chiave, decisioni e azioni.

Anche le observe, le trascrizioni e i riassunti sono tutti ricercabili in Talat.

Oltre all’aspetto della privateness, Payne ha affermato che l’obiettivo è offrire agli utenti più opzioni.

“Ci stiamo concentrando sulla configurabilità e consentendo agli utenti di controllare dove vanno i loro dati: scegli il tuo LLM, esporta automaticamente in [notetaking app] Obsidian, webhook che inviano i dati al termine di una riunione, un MCP server”, che è un modo standardizzato per gli strumenti di intelligenza artificiale di connettersi a fonti di dati esterne, “per estrarli su richiesta”, ha spiegato.

Sotto il cofano, l’intelligenza artificiale è un misto: “per lo più cucita insieme e astratta dietro FluidAudio”, ha osservato Payne, a cui attribuisce gran parte del lavoro pesante. Per quanto riguarda il riepilogo, l’app utilizza per impostazione predefinita un modello Al chiamato Qwen3-4B-4bit, che può essere eseguito anche su {hardware} abbastanza modesto.

Tuttavia, gli utenti possono scegliere di trasferirlo a qualsiasi fornitore cloud LLM di loro scelta, oppure possono scegliere tra due varianti di Parakeet – modelli di riconoscimento vocale sviluppati da Nvidia – o indirizzarlo a Ollama (uno strumento per eseguire modelli di intelligenza artificiale localmente), dando loro un maggiore controllo sull’esperienza. Col tempo, Talat aggiungerà il supporto per più scelte combine e avrà integrazioni per altre app, come Google Calendar e Notion.

Al momento del lancio, gli utenti con laptop Mac serie M (quelli che utilizzano i processori Apple, a partire dall’M1) potranno scaricare l’app e provarla gratuitamente con 10 ore di registrazioni prima di decidere di acquistarla.

Talat È disponibile per $ 49 mentre in questa versione pre-release, che è ancora in fase di sviluppo attivo.

Quando l’app raggiungerà la versione 1.0, il prezzo aumenterà a $ 99.

Payne e Franklin stanno avviando Talat e intendono mantenere il prodotto principale come un acquisto una tantum in futuro.

fonte

LEAVE A REPLY

Please enter your comment!
Please enter your name here