Het onderscheppen is een van de vele mediakanalen die OpenAI en Microsoft het afgelopen jaar hebben aangeklaagd omdat ze het werk van journalisten hebben gebruikt om ChatGPT te trainen zonder toestemming of krediet. De zaak, die OpenAI en Microsoft door de federale rechtbank proberen te laten wegwerpen, laat zien waarom digitale nieuwsmedia in het bijzonder worden blootgesteld aan AI-oplichters.
Voor alle duidelijkheid: het zijn niet alleen verkooppunten zoals deze die gevaar lopen. Acteur Scarlett Johansson beschuldigde OpenAI er maandag van haar stem na te bootsen in zijn nieuwe virtuele assistent, ondanks dat hij naar verluidt tweemaal aanbiedingen van CEO Sam Altman had afgewezen. Grotere publicaties hebben ook vragen opgeroepen over OpenAI’s benadering van menselijke arbeid. Maar in tegenstelling tot Hollywoodsterren en gedrukte publicaties worden digitale media geconfronteerd met een aantal unieke hindernissen bij het beschermen van hun werk.
Net zoals OpenAI ontkent een acteur te hebben gecast met een stem die “griezelig veel lijkt” op die van Johansson, hebben OpenAI en Microsoft geprobeerd de rechtszaak van The Intercept van zich af te schudden.
In een rechtszaak die in februari werd aangespannen beweerde The Intercept dat OpenAI en Microsoft een federale wet, de Digital Millennium Copyright Act, hadden overtreden door auteursrechtelijk beschermde verhalen te gebruiken om ChatGPT te trainen zonder licentiekosten aan uitgevers te betalen en de basisinformatie over het auteurschap te verwijderen. (Volledige openbaarmaking: naast mijn eigen rapportage voor The Intercept, ben ik ook een van de advocaten.)
“Open AI en Microsoft hebben de economische prikkel om het harde werk van online nieuwskanalen op te zuigen, waarbij ze de training, het beheer, het onderzoek en de middelen negeren die deze organisaties besteden om ervoor te zorgen dat het publiek wordt geïnformeerd met tijdig, accuraat nieuws”, aldus David Bralow. , De algemeen adviseur van The Intercept. “Ze willen graag dat we verdwalen in het algoritme, zodat ze kunnen blijven freeriden.”
Net zoals OpenAI ontkent een acteur te hebben gecast met een stem die “griezelig veel lijkt” op die van Johansson, hebben OpenAI en Microsoft geprobeerd de rechtszaak van The Intercept van zich af te schudden. Vorige maand dienden ze moties in om de zaak te seponeren, die op 3 juni voor een federale rechter in Manhattan zal worden bepleit.
Het afgelopen jaar heeft OpenAI overeenkomsten gesloten met veel perskanalen om hun inhoud in licentie te geven, waaronder de Associated Press, Le Monde, de Financial Times en Axel Springer, de Duitse uitgever die eigenaar is van Politico en Business Insider.
Een hele reeks andere verkooppunten hebben OpenAI aangeklaagd wegens verschillende vormen van misbruik van auteursrechten. De New York Times klaagde in december een rechtszaak aan, gevolgd door de Chicago Tribune, de New York Daily News en zes andere dagbladen die vorige maand eigendom waren van Alden Global Capital. Digitale verkooppunten Raw Story en AlterNet, vertegenwoordigd door hetzelfde bedrijf als The Intercept, hebben in februari een afzonderlijke rechtszaak aangespannen.
Alle aanklagers – zowel traditioneel als digitaal – merkten in rechtszaken op dat hun websites prominent voorkomen in OpenAI’s eigen lijsten met pagina’s die het had verzameld om eerdere versies van ChatGPT te trainen. De website van Intercept staat op de OpenAI-lijst van “de top 1.000 aanwezige domeinen” in gegevens die worden gebruikt om GPT-2 te trainen; Volgens de beschrijving van OpenAI bevat een van de datasets tekst die is geschraapt van meer dan 6.400 afzonderlijke pagina’s uit het domein van The Intercept.
Maar OpenAI en Microsoft hebben er bij de rechtbank op aangedrongen om de claims van The Intercept af te wijzen op tal van gronden, waaronder het feit dat The Intercept niet kan verwijzen naar elk artikel dat ooit in ChatGPT is ingevoerd.
In een brief die vorige week werd ingediend, betoogde OpenAI dat The Intercept er niet in slaagde “een enkel werk te identificeren waaruit OpenAI zogenaamd informatie over het auteursrechtbeheer had verwijderd.”
Zoals The Intercept antwoordde, zouden alleen OpenAI en Microsoft mogelijk kunnen weten welke specifieke artikelen zich in de ChatGPT-trainingssets bevinden, tenzij de rechtbank toestaat dat de zaak tot ontdekking overgaat.
Vanwege de manier waarop moderne auteursrechtbescherming werkt, hebben de New York Times en andere gedrukte publicaties veel duidelijkere claims dan The Intercept en andere digitale media. Om in aanmerking te komen voor schadevergoeding wegens inbreuk op het auteursrecht, moeten auteurs hun werken registreren bij het US Copyright Office. Het is relatief eenvoudig om gedrukte nieuwsartikelen in bulk te registreren; via een online portal kunnen publicaties in één keer een hele maand aan gedrukte uitgaven registreren.
Maar er is geen soortgelijk bulkproces voor verkooppunten die alleen online zijn, die elk artikel afzonderlijk moeten registreren bij het Copyright Office. Eerder dit jaar lanceerde het Copyright Office een nieuw registratieproces voor nieuwswebsites, dat nog steeds in behandeling is. Maar de huidige registratievereisten zijn duur en tijdrovend, en dus onpraktisch voor non-profitorganisaties met een beperkt budget, zoals The Intercept.
Niet in staat zich te beroepen op traditionele claims wegens inbreuk op het auteursrecht, wendde The Intercept zich tot enigszins nieuwe argumenten onder de DMCA, die het Congres in 1998 goedkeurde. Zoals het Copyright Office het samenvat, was de DMCA bedoeld om “de nationale auteursrechtwetgeving naar het digitale tijdperk te verplaatsen.”
Onder de DMCA is het illegaal om opzettelijk “informatie over auteursrechtbeheer” te verwijderen, zoals de titel en de auteur van een werk, en om dat werk te verspreiden in de wetenschap dat de informatie is verwijderd. The Intercept en andere eisers beweren dat OpenAI en Microsoft beide bepalingen hebben geschonden door ChatGPT te trainen in artikelen van journalisten zonder deze toeschrijvingsinformatie.
“The Intercept is niet de eerste die deze technologie uitdaagt door middel van claims onder de bepaling van de Digital Millennium Copyright Act met betrekking tot het verwijderen van informatie over auteursrechtbeheer”, schreven de advocaten van Microsoft in hun briefing, waarbij ze de rechtszaak van The Intercept “de magerste van allemaal van deze uitdagingen” noemden.
Volgende maand buigt de rechtbank zich over de vraag of de rechtszaak tegen The Intercept doorgaat.
Als de zaak wordt afgewezen, kan OpenAI ChatGPT blijven trainen om woorden uit te spuwen die “griezelig veel lijken” op het werk van digitale media als The Intercept, zonder voor dat werk te betalen.
Bron: theintercept.com