Reddit je podnio tužbu protiv tvrtke za umjetnu inteligenciju Perplexity, tvrdeći da je ilegalno koristila korisničke objave s platforme za obuku svog AI modela. Ovaj korak označava najnoviji sukob u rastućem konfliktu između vlasnika sadržaja i industrije umjetne inteligencije, koji se sve više fokusira na prava na podatke.
Tužba je podnesena saveznom sudu u New Yorku u srijedu, a uz Perplexity, imenovana su još tri tuženika koje Reddit optužuje za pomaganje u prikupljanju podataka. To su litavski scraper podataka Oxylabs, “bivši ruski botnet” AWMProxy, i teksaški startup SerpApi. Reddit tvrdi da su ove tri manje tvrtke koristile napredne tehnike za zaobilaženje tehnoloških zaštita kako bi prikupile zaštićene objave sa Reddita, skrivajući svoje identitete i lokacije te prikrivajući svoje web scrapere kao obične korisnike interneta.
Perplexity, tvrtka koja upravlja tražilicom pokretanom umjetnom inteligencijom, odbacila je optužbe, optužujući Reddit za “iznudu” i protivljenje otvorenom internetu. Također, SerpApi je za CNBC izjavio da se “snažno ne slaže” s Redditovim tvrdnjama te da će se braniti na sudu.
Veliki broj slučajeva
Ovaj slučaj samo je jedan od mnogih koji su pokrenuti u vezi s korištenjem materijala zaštićenih autorskim pravima u treniranju velikih jezičnih modela umjetne inteligencije. Reddit je posebno bio na prvoj liniji u ovom sukobu, pokrenuvši sličnu tužbu protiv startupa za umjetnu inteligenciju Anthropic u lipnju. CNBC nije uspio kontaktirati Oxylabs i AWMProxy za komentar.
Ben Lee, glavni pravni direktor Reddita, izjavio je da su tvrtke za umjetnu inteligenciju “zaglavljene u utrci u naoružanju za kvalitetan ljudski sadržaj”, te da je taj pritisak stvorio “ekonomiju ‘pranja podataka’ industrijskih razmjera”. Scraperi, koji zaobilaze zaštitu, ukradu podatke i prodaju ih klijentima koji ih koriste za obuku AI modela, a Reddit je postao glavna meta zbog svoje velike zbirke ljudskih razgovora.
Reddit, koji okuplja preko 100.000 zajednica temeljenih na različitim interesima (tzv. subreddits), u svojoj tužbi navodi da su postovi korisnika postali najčešće citirani izvor odgovora generiranih umjetnom inteligencijom na Perplexityju. Kao odgovor, Reddit je Perplexityju poslao pismo o prestanku i odustajanju, nakon čega je broj citata s Reddita “četrdeset puta porastao”.
Istraživači umjetne inteligencije prethodno su napomenuli da brojni moderirani razgovori na Redditu mogu pomoći AI chatbotovima u proizvodnji prirodnijih i relevantnijih odgovora.


