Zadnje objave

Možda vam se sviđa

Reddit tužio Perplexity zbog krađe korisničkih objava za treniranje umjetne inteligencije

Reddit je podnio tužbu protiv tvrtke za umjetnu inteligenciju Perplexity, tvrdeći da je ilegalno koristila korisničke objave s platforme za obuku svog AI modela. Ovaj korak označava najnoviji sukob u rastućem konfliktu između vlasnika sadržaja i industrije umjetne inteligencije, koji se sve više fokusira na prava na podatke.

Tužba je podnesena saveznom sudu u New Yorku u srijedu, a uz Perplexity, imenovana su još tri tuženika koje Reddit optužuje za pomaganje u prikupljanju podataka. To su litavski scraper podataka Oxylabs, “bivši ruski botnet” AWMProxy, i teksaški startup SerpApi. Reddit tvrdi da su ove tri manje tvrtke koristile napredne tehnike za zaobilaženje tehnoloških zaštita kako bi prikupile zaštićene objave sa Reddita, skrivajući svoje identitete i lokacije te prikrivajući svoje web scrapere kao obične korisnike interneta.

Perplexity, tvrtka koja upravlja tražilicom pokretanom umjetnom inteligencijom, odbacila je optužbe, optužujući Reddit za “iznudu” i protivljenje otvorenom internetu. Također, SerpApi je za CNBC izjavio da se “snažno ne slaže” s Redditovim tvrdnjama te da će se braniti na sudu.

Veliki broj slučajeva

Ovaj slučaj samo je jedan od mnogih koji su pokrenuti u vezi s korištenjem materijala zaštićenih autorskim pravima u treniranju velikih jezičnih modela umjetne inteligencije. Reddit je posebno bio na prvoj liniji u ovom sukobu, pokrenuvši sličnu tužbu protiv startupa za umjetnu inteligenciju Anthropic u lipnju. CNBC nije uspio kontaktirati Oxylabs i AWMProxy za komentar.

Ben Lee, glavni pravni direktor Reddita, izjavio je da su tvrtke za umjetnu inteligenciju “zaglavljene u utrci u naoružanju za kvalitetan ljudski sadržaj”, te da je taj pritisak stvorio “ekonomiju ‘pranja podataka’ industrijskih razmjera”. Scraperi, koji zaobilaze zaštitu, ukradu podatke i prodaju ih klijentima koji ih koriste za obuku AI modela, a Reddit je postao glavna meta zbog svoje velike zbirke ljudskih razgovora.

Reddit, koji okuplja preko 100.000 zajednica temeljenih na različitim interesima (tzv. subreddits), u svojoj tužbi navodi da su postovi korisnika postali najčešće citirani izvor odgovora generiranih umjetnom inteligencijom na Perplexityju. Kao odgovor, Reddit je Perplexityju poslao pismo o prestanku i odustajanju, nakon čega je broj citata s Reddita “četrdeset puta porastao”.

Istraživači umjetne inteligencije prethodno su napomenuli da brojni moderirani razgovori na Redditu mogu pomoći AI chatbotovima u proizvodnji prirodnijih i relevantnijih odgovora.

Prijavite se na naš Newsletter

Popularno