In de rechtszaal, de New York Times heeft een harde lijn tegen OpenAI genomen. De krant heeft de kunstmatige intelligentie-startup samen met investeerder en partner Microsoft aangeklaagd, omdat OpenAI artikelen zou hebben gescrapt zonder toestemming of compensatie. De Times wil OpenAI en Microsoft verantwoordelijk houden voor miljarden dollars aan schade.

Tegelijkertijd omarmt de Times ook de generatieve AI-technologie van OpenAI.

The Times wil OpenAI en Microsoft aansprakelijk stellen voor miljarden dollars aan schade.

Dat The Times de technologie gebruikte, kwam aan het licht dankzij gelekte code waaruit bleek dat het een tool had ontwikkeld die OpenAI zou gebruiken om koppen voor artikelen te genereren en “te helpen bij het toepassen van de stijlgids van The New York Times” – waarbij functies werden uitgevoerd die, als ze in de nieuwsredactie werden toegepast, normaal gesproken door redacteuren van de krant werden uitgevoerd.

“Het project waar u naar verwijst was een heel vroeg experiment van ons engineeringteam, ontworpen om generatieve AI en de mogelijke use cases ervan te begrijpen,” vertelde Times-woordvoerder Charlie Stadtlander aan The Intercept. “In dit geval werd het experiment niet verder gebracht dan testen en werd het niet gebruikt door de redactie. We blijven experimenteren met mogelijke toepassingen van AI ten behoeve van onze journalisten en ons publiek.”

Mediakanalen maken steeds vaker gebruik van kunstmatige intelligentie — met behulp van grote taalmodellen, die leren van het opnemen van tekst om vervolgens taal te genereren — om verschillende taken uit te voeren. AI kan bijvoorbeeld worden ingezet om grote datasets te sorteren.

Meer publiekelijk gebruik van AI heeft soms tot schaamte geleid. Sports Illustrated verwijderde berichten op haar site nadat haar lezers onthulden dat sommige van haar auteurs door AI waren gegenereerd. De Britse tabloid Daily Mail plaatste een AI-artikel waarin een satire van Saturday Night Live voor echt nieuws werd aangezien.

Sommige newsroom-toepassingen voor AI zijn heimelijk, maar in sommige gevallen publiceren outlets hun AI-werk. Newsweek kondigde bijvoorbeeld een uitgebreide, zij het vage, omarming van AI aan.

Net als andere media is de Times niet verlegen geweest over het gebruik van AI. De website van het Research and Development-team van de krant zegt: “Kunstmatige intelligentie en journalistiek kruisen elkaar in onze verslaggeving, redactie en betrokkenheid bij lezers.” De Times-site benadrukt 24 use cases van AI bij het bedrijf; de stijlgids en het headlineproject worden daar niet bij genoemd.

Vanwege de regurgitatieve manier van werken, kijken velen sceptisch naar AI in nieuwsredacties. Terwijl de media-industrie banen verliest — meer dan 20.000 posities gingen verloren in 2023 — zijn er ook zorgen dat AI nog meer rollen van journalisten zou kunnen overnemen. In 2017 schafte de Times haar copy edit desk af, waardoor een aantal copy editors andere rollen kregen. De desk was voorheen verantwoordelijk voor het handhaven van de stijlgids, een van de taken die de publicatie testte met AI.

Een screenshot van een tool die het onderzoeks- en ontwikkelingsteam van de New York Times heeft ontwikkeld om OpenAI te gebruiken voor het schrijven van koppen.
Schermafbeelding: The Intercept

De Times-code werd vorige maand openbaar toen een anonieme gebruiker op het 4chan-prikbord een link plaatste naar een verzameling van duizenden van de GitHub-repositories van de New York Times, in feite opslag van verzamelingen code voor samenwerkingsdoeleinden. Een tekstbestand in het lek zei dat het materiaal een “min of meer complete kloon van alle repositories van The New York Times op GitHub” vormt.

The Times bevestigde de authenticiteit van het lek in een verklaring aan BleepingComputer, waarin stond dat de code in januari “per ongeluk beschikbaar werd gesteld”.

Het lek bevat meer dan 6.000 repositories met in totaal meer dan 3 miljoen bestanden. Het bestaat uit een brede verzameling materialen die de technische kant van de Times bestrijken, maar er lijkt weinig van de nieuwsredactie of zakelijke kant van de organisatie in het lek te zijn opgenomen.

The Times heeft $ 1 miljoen uitgegeven aan zijn rechtszaak waarin hij beweerde dat er sprake was van inbreuk op het auteursrecht tegen OpenAI en Microsoft. The Intercept is verwikkeld in een aparte rechtszaak tegen OpenAI en Microsoft onder de Digital Millennium Copyright Act.

“Improviseer niet”

Een van de AI-projecten van de New York Times, getiteld “OpenAI Styleguide”, wordt in de bijbehorende documentatie beschreven als een “prototype dat OpenAI gebruikt om de stijlgids van de New York Times toe te passen.” Het project omvat ook een headlinegenerator.

De stijlgidschecker maakt gebruik van een groot OpenAI-taalmodel dat bekendstaat als Davinci om alle fouten in de kop van een artikel, de byline, de datumregel of de kopie (de tekst van het artikel) te corrigeren die de stijlgids van de Times schenden. De prompt vertelt de OpenAI-bot: “Improviseer niet. Gebruik geen regels die u elders hebt geleerd.”

Een exemplaar van de stijlgids van Times is te vinden in een aparte repository, die ook beschikbaar is in het lek.

Het onderdeel van het project dat de headlines genereert, vertelt OpenAI: “Je bent een headline-schrijver [sic] voor The New York Times. Gebruik het volgende artikel als context. Gebruik geen voorkennis.” De generator stelt de operator ook in staat om verschillende beperkingen op te leggen, zoals het specificeren welke woorden wel en niet gebruikt moeten worden.

“Maak een genummerde lijst van drie nuchtere, verfijnde, eerlijke nieuwskoppen op basis van de eerste drie alinea’s van het volgende verhaal.”

Het OpenAI Styleguide-project is niet het enige voorbeeld dat de Times heeft geëxperimenteerd met het gebruik van OpenAI voor het genereren van koppen. Een andere repository bevat een apart project voor het genereren van koppen met behulp van een OpenAI-chatbot genaamd ChatGPT. Het project was onderdeel van een Maker Week bij de Times, waarin medewerkers werken aan ‘zelfgestuurde projecten’. De Maker Week-koppengenerator vertelt de bot: ‘Genereer een genummerde lijst van drie nuchtere, verfijnde, rechttoe rechtaan nieuwskoppen op basis van de eerste drie alinea’s van het volgende verhaal.’

Een ander Maker Week-project dat gebruikmaakt van OpenAI-tools is ‘counterpoint’, dat wordt omschreven als een ‘applicatie die tegenargumenten genereert voor opiniestukken’. Het project lijkt nog niet af te zijn en geeft de bot alleen de opdracht om trefwoorden uit een artikel te halen.

Naast OpenAI Styleguide bevat de Times Github-leak broncode voor verschillende applicaties. Sommige zijn onderzoeksprojecten — “een poging om een ​​voorspellend model van printabonnementenverloop te bouwen” — en andere omvatten zaken als technische sollicitatiegespreksvragen, trainingsmateriaal voor personeel, authenticatiegegevens, prototypes voor niet-uitgebrachte games en verschillende persoonlijke informatie.




Bron: theintercept.com



Laat een antwoord achter