È ampiamente riconosciuto che le società di intelligenza artificiale utilizzano articoli net per addestrare i propri modelli senza compensare i creatori o ottenere il permesso. Editori come il New York Occasions, il Chicago Tribune e il Toronto Star hanno già intentato causa contro questa pratica. Ora, un’altra importante organizzazione si è unita al procedimento legale.
Lo ha riferito Techcrunch che hanno l’Enciclopedia Britannica e la sua controllata Merriam-Webster ha intentato una causa contro OpenAI, sostenendo che il gigante dell’intelligenza artificiale ha commesso una “massiccia violazione del copyright” raschiando e utilizzando quasi 100.000 dei suoi articoli on-line per formare i suoi LLM senza permesso.
Di cosa tratta questa causa?
Britannica sostiene che ChatGPT genera risposte che ne sostituiscono il contenuto, riducendo il traffico net e le potenziali entrate. Se gli utenti possono porre una domanda a ChatGPT e ricevere una risposta basata sugli articoli di Britannica, potrebbero esserci meno incentivi a visitare direttamente il sito net.
La denuncia prende di mira anche l’uso da parte di OpenAI dei contenuti Britannica nel flusso di lavoro RAG di ChatGPT, un processo in cui l’IA scansiona il net per informazioni aggiornate quando risponde alle domande, sostenendo che l’IA ne riproduce il contenuto, in tutto o in parte, quando risponde alle domande.
Inoltre, la Britannica sostiene che OpenAI stia violando la legge sui marchi. La società ha sostenuto che ChatGPT allucina le informazioni e poi le attribuisce falsamente all’editore. Secondo Britannica, le allucinazioni di ChatGPT mettono a repentaglio “il continuo accesso del pubblico a informazioni on-line affidabili e di alta qualità”.
Cosa succederà dopo?
Questa è la grande domanda. Non esiste un forte precedente legale che stabilisca se l’addestramento di un’intelligenza artificiale su contenuti protetti da copyright costituisca una violazione del copyright. Chiunque può dirti che non è giusto usare il lavoro di qualcun altro per addestrare i tuoi dati, ma la legge al riguardo è nella migliore delle ipotesi oscura.
In un recente caso che coinvolge Anthropic, un giudice federale ha stabilito che l’utilizzo di contenuti protetti da copyright come dati di formazione period sufficientemente trasformativo da essere legale. Tuttavia, lo stesso giudice ha scoperto che Anthropic aveva scaricato illegalmente milioni di libri, ottenendo un risarcimento di 1,5 miliardi di dollari con gli scrittori interessati.
Poiché la questione continua advert evolversi, i legislatori hanno un terreno significativo da percorrere. L’esito di questi casi probabilmente determinerà il modo in cui le società di intelligenza artificiale potranno utilizzare legalmente i contenuti net in futuro.












