Mii de cărți sunt folosite ilegal pentru a antrena sistemele de inteligență artificială. Care sunt acestea

Aproape 200.000 de cărți sunt folosite pentru a antrena sisteme de inteligență artificială de către unele dintre cele mai mari companii din domeniul tehnologiei. Însă nimeni nu le-a spus autorilor, scrie CNN.

Sistemul se numește Books3 și, conform unei investigații realizate de The Atlantic, setul de date se bazează pe o colecție de cărți electronice piratate care acoperă toate genurile, de la ficțiune erotică până la poezie și proză. Cărțile ajută sistemele AI generative să învețe cum să comunice informații.

Unele texte de instruire AI pot fi extrase din articole care sunt postate pe internet, dar A.I. de înaltă calitate necesită text de înaltă calitate pentru a absorbi limbajul. Aici intervin cărțile. Books3 este deja subiectul mai multor procese împotriva META și a altor companii care folosesc sistemul pentru a instrui AI.

Acum, mulțumită unei baze de date publicate de The Atlantic săptămâna trecută, autorii pot vedea dacă cărțile lor sunt folosite în mod special pentru a antrena aceste sisteme AI.

„Sunt complet evidențiată și năucită. Sunt revoltată și, în același timp, mă simt total neajutorată”, a scris Mary H. K. Choi pe rețelele de socializare, după ce a descoperit că munca ei era folosită.

Choi, al cărei roman de debut „Emergency Contact” a apărut în baza de date, și-a explicat în continuare sentimentele într-un e-mail. Cartea, care se concentrează pe o tânără coreeano-americană care navighează într-o nouă relație, a fost „profund personală”, iar lui Choi i s-a spus inițial că povestea ei este „prea liniștită și de nișă”. Cartea a devenit mai târziu un bestseller al New York Times și are fani din întreaga lume.

Citește și:

Exit mobile version