Meta saksøkes for å ha brukt piratkopiert materiale i KI-trening
Nyhetsartikkel - Amanda Barth Gulbrandsen
Meta er saksøkt for å ha stjålet materiale fra millioner av opphavsrettsbeskyttede bøker og forskningsartikler uten tillatelse da de utviklet språkmodellen Llama 3.
Den 20. mars 2025 publiserte The Atlantic en søkbar database over titler som finnes i Library Genesis (LibGen), som kan ha blitt brukt som treningsmateriale for modellen. Nå saksøker elleve forfattere i USA Meta Platforms, Inc. for å ha begått et omfattende direkte brudd på opphavsretten i henhold til § 501 i den amerikanske opphavsrettsloven.
Millioner av opphavsrettsbeskyttede bøker og forskningsartikler kan ha blitt brukt uten tillatelse. Forfattere frykter for sitt levebrød. Foto: Immo Wegmann / Unsplash
Ulovlig i Europa
Meta baserer seg nå på en «fair use»-fortolkning (rimelig bruk) etter § 107 i opphavsrettsloven i USA, men eksperter peker på at dette ikke gjelder ved kommersiell bruk. I Europa vil en slik praksis trolig anses som ulovlig, forteller professor i medieinnovasjon og forsker på bruk av generativ kunstig intelligens og sosiale medier ved Universitet i Oslo, Petter Bae Brandtzæg.
Professor i medieinnovasjon og forsker på bruk av generativ kunstig intelligens og sosiale medier ved Universitet i Oslo, Petter Bae Brandtzæg. Foto: Jarli & Jordan / Universitetet i Oslo
Brandtzæg oppdaget selv gjennom databasen til The Atlantic at flere av hans egne forskningsartikler er blant dokumentene som potensielt har blitt brukt i treningsdataene til Llama 3.
Raskere og billigere
Ifølge The Atlantic vurderte selskapet opprinnelig å kjøpe tilgang, men valgte i stedet å bruke materialet ulovlig fordi det var både raskere og billigere – til tross for at Meta har en markedsverdi på over 15 000 milliarder kroner, forteller Brandtzæg.
OpenAI har også blitt beskyldt for å bruke piratkopiert materiale i utviklingen av sine modeller, men argumenterer – i likhet med Meta – med at generativ KI skaper nytt innhold og dermed ikke regnes som kopiering skriver The Atlantic.
Blant de juridiske vedleggene i søksmålet mot Meta er det vedlagt intern kommunikasjon der ansatte i selskapet diskuterer bruken av opphavsrettsbeskyttede bøker i KI-trening. Utdrag viser hvordan Meta-ansatte diskuterer hvor mye arbeid det ville være å innhente lisens fra hver enkelt forfatter – og hvorfor det er enklere å bruke materialet uten godkjenning.
I én e-post bekrefter Meta-sjef Mark Zuckerberg at databasen kan brukes videre, det legges frem strategier for hvordan dette kan gjøres og risikoen som medfølger.
Alvorlig påvirkning på forfattere og skribenter
Ansatte i Meta diskuterer arbeidsmengde som kommer med å få lisenser for treningsmateriale. Utklipp: Vedlegg i søksmålet mot Meta.
Brandtzæg poengterer at dette kan ha alvorlig påvirkning på forfattere og skribenter som lever av tekstene sine:
– Når aktører som Meta bruker piratarkiv som LibGen, med over 7,5 millioner bøker og 81 millioner forskningsartikler, for å trene KI-modeller, uten å innhente samtykke eller betale for innholdet, er det selvsagt prinsipielt problematisk, i tillegg til at det også potensielt er ulovlig, forteller Brandtzæg.
Over 46 000 forfattere har skrevet under på en underskriftskampanje som krever at Meta holdes ansvarlig. Forfattere utrykker frykt for sitt levebrød i protester utenfor selskapets hovedkontor i London skriver The Guradian.
“Prepare for some serious buksevann”
Fagforening for norske forfattere, Forfatterforbundet, kaller bruken av slike databaser for et misbruk, og oppfordrer medlemmene sine til å si fra hvis de finner bøkene sine på listen over materiale brukt i KI-trening. Forfatterforbundet skriver på sin nettside at medlemmene bør dele i egne sosiale medier, bruke hashtag #DontZuckOurBooks, tagge Meta og Mark Zuckerberg, og sende dokumentasjon til European Writers’ Council, en internasjonal non-profit-organisasjon som jobber for å sikre forfatteres rettigheter.
Den norske Forfatterforening postet på sosiale medier:
“We demand that Meta remove any and all pirated books from their training database immediately. If not, prepare for some serious buksevann.”
Som ansatt ved Universitetet i Oslo sier Brandtzæg at det ikke er så alvorlig for han personlig at hans forskning blir brukt i KI-trening:
– Jeg er veldig heldig, og får uansett lønn fra Universitetet i Oslo, og det meste av forskningen vår publiseres i dag som open access og skal ut til folket uansett. Vi forskere har i praksis lite eierskap til artiklene våre, og det er nesten forventet at vi gir fra oss rettighetene, sier Brandtzæg.
Politiske og økonomiske krefter i sving
Metas egne algoritmer på Facebook gjorde også at professor ved Institutt for medier og kommunikasjon, og leder for studier av politisk kommunikasjon ved UiO, Eli Skogerbø, oppmerksom på at hennes egne tekster ble brukt i AI-trening. Det oppdaget hun etter å ha sett et innlegg fra en tidligere kollega som fant navet sitt i The Atlantics liste over materiale hentet fra LibGen.
– At piratkopiert materiale brukes til AI-trening, overrasker meg ikke, men det er forkastelig og noe som ikke burde skje, sier Skogerbø.
Professor ved Institutt for medier og kommunikasjon, og leder for studier av politisk kommunikasjon ved UiO, Eli Skogerbø. Foto: Universitetet i Oslo
– Opphavsretten er sårbar og krever stor grad av integritet fra aktørene. Regelverket eksisterer, og det er mulig å følge. Men det er store økonomiske krefter som ikke forholder seg til retningslinjene som finnes – eller så bryr de seg rett og slett ikke, sier hun.
– Teknologiselskapene er avhengige av tilgang til denne typen materiale, særlig bøker, fordi de trenger store tekstmengder. Men her ser vi et tydelig brudd på normer og konvensjoner for opphavsrett. Det er stor motstand blant de store teknologiselskapene mot å regulere dette feltet, slik EU vil gjøre, sier Skogerbø.
Sammenvevd med Trumps administrasjon
Hun knytter også problematikken til politiske endringer i USA:
– De store teknologiselskapene er nå tett sammenvevd med Trumps administrasjon. De støttet Trump i valgkampen, blant annet for å motarbeide restriksjoner som dette, forteller Skogerbø.
Søksmålet om bruk av piratkopiert materiale er ikke det eneste juridiske presset teknologigiganten Meta nå står overfor. Den 15. april 2025 startet en omfattende rettssak der det amerikanske konkurransetilsynet FTC anklager selskapet for å ha etablert et monopol gjennom de statlig godkjente oppkjøpene av Instagram i 2012 og WhatsApp i 2014.
Ifølge FTC var formålet med oppkjøpene å eliminere konkurranse i markedet. Donald Trump har tidligere kritisert tilsynet, og VG skriver at Mark Zuckerberg skal ha forsøkt å bygge en allianse med Trump-administrasjonen.
Rettsaken er forventet å pågå i flere uker.