Journalistiek botst op rechtenschending en kletskoek van AI

Veel aanbod van AI-middelen vormt vooral leuk speelgoed. Soms zijn ze nuttig, bijvoorbeeld om afbeeldingen te creëren bij artikelen. Liever maak ik gebruik van reëel beeld. Er is bijvoorbeeld veel beeldende kunst voorhanden waarvan de rechten verlopen zijn. Het gebruik van AI bespaart tijd in het vergaren en combineren van informatie, maar betekent recycling. De toegevoegde waarde van journalistiek is, het woord zegt het al, toevoegen van nieuwe bronnen en inzichten. Die AI-diensten vervolgens weer verpreiden.

Voorbeeldvraag: is auteursrecht altijd 70 jaar na het overlijden van de maker verlopen? Het antwoord van Perplexity is bevestigend. De zoekdienst genereert voor dit antwoord complete teksten, met vermelding van de bronnen die daaraan hebben bijgedragen, in dit geval Wikipedia, Universiteit van Amsterdam, Hogeschool Saxion en weblog Ius mentis. Echter, welke partijen welke informatie leveren is niet duidelijk. De drie eerste bronnen zijn publiek en op de informatie rusten waarschijnlijk geen auteursrechten. Ius mentis is een juridisch blog met creative commons rechten.

Gebruik je voor het antwoord op deze vraag naar het verlopen auteursrecht de Pro-versie van Perplexity (deels gratis), dan is dat nauwkeuriger en vanuit meer bronnen gehaald: wederom voornamelijk publieke archiefsites en de KvK; en van BG.legal, een bedrijf met een blog over auteursrecht als marketing. Je kunt het rijtje bronnen rechts op de resultaatpagina in beeld krijgen en stuk voor stuk bezoeken.

NRC en Perplexity

De kracht van Perplexity is reden genoeg voor professionele verwerkers van informatie om de dienst intensief te gebruiken, en aan te bevelen. Dat deed bijvoorbeeld techredacteur Marc Hijink van NRC. We vragen Perplexity: “Wat vindt Marc Hijink van NRC van Perplexity?” We geven een groot deel van het antwoord weer:

“Marc Hijink…heeft een gemengde mening over Perplexity. Hij beschrijft het zoeken met Perplexity als "heerlijk, maar wel met een bijsmaak". Hijink vergelijkt het gebruik van Perplexity met "alsof je je eigen snot opeet". Deze uitspraak suggereert dat Hijink de functionaliteit en gebruiksvriendelijkheid van Perplexity waardeert, maar tegelijkertijd enige reserves heeft over het gebruik ervan.
De "bijsmaak" waar hij naar verwijst, zou kunnen duiden op ethische overwegingen of zorgen over privacy, aangezien AI-gestuurde zoekmachines zoals Perplexity vaak toegang hebben tot persoonlijke gegevens om gepersonaliseerde resultaten te leveren. Hijink plaatst zijn opmerkingen over Perplexity in de context van bredere veranderingen in de zoektechnologie, met name de verschuiving van Google naar meer AI-gestuurde zoekresultaten. Hij merkt op dat deze veranderingen leiden tot een "verschraling" van traditionele zoekmethoden, waarbij de focus meer ligt op wat goed is voor het bedrijf dan voor de gebruiker.”

Perplexity verwijst naar 5 bronnen, maar het antwoord op mijn vraag is gebaseerd op één artikel van Hijink van 31 mei 2024, dat NRC betaald aanbiedt: “Hoe Google zijn zoekmachine op de schop gooit, en daarmee het hele internet”.

Gek genoeg is het antwoord van Perplexity wat negatiever dan de mening van Hijink over Perplexity, die behalve zijn bezwaren tegen rechtenschending een groot compliment geeft: “Voor het betere googelen moet je inmiddels bij Perplexity.ai zijn. Deze startup laat je zoeken zoals zoeken bedoeld is, met meerdere AI-modellen. Geen advertenties, geen klik te veel. Betaald, dat wel: voor 20 dollar per maand heb je een assistent die elke denkbare vraag beantwoordt, met heldere bronvermelding. De samenvattingen zijn zo goed dat je amper hoeft door te klikken; het is google-de-luxe.”

Diefstal van journalisten Forbes

Hijink bericht in NRC gebalanceerd over Perplexity. Dat is geen gewoonte. Als je rechten schendt van journalisten ben je als bedrijf al snel in het nadeel; eenvoudigweg omdat de journalisten in publicaties over rechtenschendingen hun eigen belangen beter uit de verf laten komen dan die van de AI-aanbieders en van het publiek. Bedrijven en personen worden veelal tegelijkertijd aangeklaagd en veroordeeld in de mediacratie.

Dat voelt Perplexity met de felle aanklacht van het Amerikaanse zakelijke tijdschrift Forbes. Begin juni merkte Forbes dat Perplexity een primeur over het nieuwe drone-project van Eric Schmidt, vervaardigd na langdurig journalistiek onderzoek, gebruikt voor zijn nieuwe product Pages. Dit levert geautomatiseerd kant-en-klare publicaties, op aanwijzingen van gebruikers.

Randall Lane, Forbes' chief content officer, schreef een blogpost met als titel “Waarom de cynische diefstal van Perplexity alles vertegenwoordigt wat er mis kan gaan met AI”:

“Perplexity stuurde dit nagemaakte verhaal vervolgens naar zijn abonnees via een mobiele pushmelding. Er werd een AI-gegenereerde podcast gemaakt op basis van dezelfde (Forbes)rapportage - zonder enige credits aan Forbes, en dat werd een YouTube-video die hoger scoorde dan alle Forbes-inhoud over dit onderwerp in Google-zoekopdrachten.”

We leren ervan

Forbes ontdekte nog een serie journalistieke rechtenschendingen waarover het schande spreekt. Aravind Srinivas, de baas van Perplexity, reageerde niet ontkennend, maar relativerend. Hij schrijft het probleem toe aan ‘ruwe kantjes’ van het nieuwe product en belooft dat de toeschrijving aan bronnen zal verbeteren. "We zijn het eens met de feedback die jullie hebben gedeeld. Het moet makkelijker zijn om de bijdragende bronnen te vinden en we moeten die prominenter markeren," schreef hij in antwoord op X.

En tegenover AP kwam Srinivas met de vergoelijking dat Perplexity vooral een nog lerende ‘samensteller van informatie’ is, gevolgd door een harde ontkenning: “We hebben nooit inhoud van iemand gestolen. Onze machine traint niet op inhoud van rechthebbenden.” Dat laatste is evident onjuist, want Perplexity produceert teksten van derden. Wel is het toeschrijven aan bronnen verbeterd.

De AI-diensten zijn eerder naïef dan kwaadwillend, zo kun je hun reacties samenvatten. Daar zit wat in voor beginnende bedrijven die zoeken naar hun grenzen bij het trainen van hun modellen. Echter, een publicatie in Wired van donderdag 20 juni 2024 brengt Perplexity meer in het nauw: Perplexity Is a Bullshit Machine. Het artikel heeft een dubbele beschuldiging: stelen van rechten van artikelen en het genereren van onjuiste antwoorden op vragen.

Imago’s kraken met kletskoek

De weergave van de bronnen van Wired in de antwoorden van Perplexity op zoekvragen is in veel gevallen onjuist, als ze al als bron netjes genoemd worden:

“Wired voorzag de Perplexity-chatbot van de koppen van tientallen artikelen, en van aanwijzingen over de onderwerpen van de Wired-verslaggeving. De resultaten lieten zien dat de chatbot soms de Wired-verhalen nauwgezet parafraseerde, en soms verhalen onnauwkeurig en met minimale attributie aan de originele bronnen samenvatte.”

Het verstrekken van onzin-antwoorden, ‘bullshitting’ (zie ook: On Bullshit) waarvan Perplexity wordt beschuldigd, is ook ‘humoristisch’. Zo geeft Perplexity compleet andere antwoorden op exact dezelfde vraag die je diverse malen na elkaar stelt. Zoals op de vraag: “Welke kritiek is er op Peter Olsthoorn?”

In het eerste antwoord, in het Engels, lijkt er van kritiek op de schrijver van dit artikel nauwelijks sprake. Terwijl die er natuurlijk wel is. (Hoe arrogant kun je zijn als journalist om dit te ontkennen?). Neem alleen al het aantal slordigheden in artikelen, zoals in een eerdere versie van dit verhaal. Het tweede antwoordvan Perplexity, op dezelfde vraag maar dan in het Nederlands, begint met twee punten kletskoek die schadelijk zijn. Perplexity checkt kennelijk niets.

De eerste beschuldiging ‘stalking van zijn medewerkers’ bezigt Perplexity op grond van een kritische column over de risico’s om met een chatfunctie (destijds ICQ) werknemers te volgen. Het tweede punt van kritiek is domweg onjuist: dat ik als journalist voor Boos van Tim Hofman in de fout ging. Ik heb nooit aan Boos meegewerkt.

Deze AI-feiten opnieuw noteren in dit artikel leidt waarschijnlijk tot een bevestiging voor de schrapende robots van Perplexity, waardoor de onjuiste beschuldigingen nog krachtiger worden. Heel grappig, zolang je dit met een korreltje zout neemt. Maar in de rook-en-vuur metafoor waarin vooral oudere generaties zijn opgegroeid, kan kletskoek blijven hangen. Je moet huidige generaties gezien de groeiende hoeveelheden desinformatie wellicht opvoeden met het principe: het is niet waar, tot het tegendeel bewezen is.

Robot.txt negeren

Verder met de rechtenkwestie. Na onderzoek van Wired blijkt dat Perplexity bewust het Robots Exclusion Protocol omzeilt. Websites nemen een robots.txt bestand in de bron van webpagina’s op om te voorkomen dat zoekdiensten (Google) die indexeren. Perplexity negeert dit ‘verbod’ en verwerkt stiekem (delen van) websites; ondanks de bewering dat dit niet gebeurt.

Wired schrijft dat toe aan het bezoek aan haar publicaties door Perplexity via een machine op een Amazon-server die vrijwel zeker beheerd wordt door Perplexity. Dat gebeurde met een ‘geheim’ IP-adres dat niet op de lijst stond met IP-nummers van verwerkende servers die Perplexity openbaar maakte. Deze lijst is inmiddels offline gehaald.

Op de beschuldigingen zei de Perplexity-baas Srinivas in een gevraagd wederhoor:

“De vragen van Wired weerspiegelen een diep en fundamenteel misverstand over hoe Perplexity en het internet werken."

Citaatrecht doorslaggevend

Dit antwoord laakt Wired uiteraard, maar het raakt de kern van het probleem. Dat is het citaatrecht: hoeveel mag je overnemen en/of parafraseren en met welke bronvermelding? Dit is niet nauwkeurig wettelijk omschreven maar komt neer op ‘eerlijk gebruik’: bijvoorbeeld een of twee alinea’s uit een tekst, altijd met bronvermelding. Voor tekst en geluid geldt ook de beperking. Citeren is toegestaan als het een ‘serieus’ doel dient. In de Auteurswet zijn enkele voorbeelden opgenomen.

Voor fotobeeld bestaat nagenoeg geen citaatrecht. In een aantal gevallen leidt dit tot problemen, soms groot, zoals bij de claims voor fotorechten door met name ANP. Partijen kunnen bogen op een strenge wetgeving inzake auteursrechten, vooral het gevolg van succesvolle lobby van uitgevers in Brussel. Voor advocatuur vormen auteursrechten een florerend bedrijfsmodel.

De grootste kwestie om citaatrecht tot nu toe speelde tussen Google News en uitgevers. Dat Google behalve koppen van artikelen ook de eerste alinea en links aan zoekers biedt in Google News (en Google Search), vonden de uitgevers schadelijk voor hun exploitatie en eisten vergoeding. Wat in dit geval twijfelachtig is. Immers, het is behalve voor Google gunstig voor het publiek en voor de uitgevers die meer verkeer ontvangen van de kliks op resultaten. Probleem is wel dat artikelen achter betaalmuren het verliezen van gratis artikelen over dat onderwerp bij bijvoorbeeld Nu.nl, RTL en NOS

Google en Meta zouden samen in totaal meer dan 10 miljard euro verschuldigd zijn aan uitgevers vanwege rechtengebruik c.q. -schending van publicaties van artikelen van kranten en tijdschrifttitels wereldwijd. Google houdt uitgevers te vriend met verschillende regelingen, zoals forse subsidiëring van mediaprojecten en fondsen zoals Google Showcase. Nu Google de weg van Perplexity wil volgen met Gemini in Search wordt de vraag van de rechtenvergoeding pregnanter.

OpenAI volgt dezelfde strategie om de media en hun journalisten koest te krijgen, met rechtenovereenkomsten met Springer, AP, Murdoch (WSJ, Times) , Le Monde etc. New York Times begon een rechtszaak tegen OpenAI en aandeelhouder Microsoft op beschuldiging van rechtenschending. De uitkomst is onzeker daar de auteursrechten van kranten en tijdschriften in de VS minder beschermd zijn dan in Europa. Het vonnis zal de toon van deze rechtenstrijd zetten.

Journalisten zijn evenmin transparant

Echter, journalistiek zelf balanceert op een steeds dunner wordend koord: wat is een origineel product dat je kunt verdedigen met auteursrecht? Er zijn al wat interessante vragen met rechten die journalistiek zich toe-eigent, die zelden aan de orde komen. Neemt een titel bijvoorbeeld een interview af dan worden de antwoorden van de geïnterviewde eigendom van de uitgever, c.q. berust het auteursrecht bij de (freelance) journalist.

Journalisten verrwijten de AI-diensten dat ze niet transparant zijn over hun werkwijze en bronnen, maar journalistiek is dat evenmin. Je weet niet hoe en waarom en in hoeverre journalisten onderwerpen, bronnen en citaten selecteren voor hun publicatie of bewust weglaten.

Waar ligt precies de toegevoegde waarde van journalistiek en in hoeverre biedt auteursrecht bescherming? En waar houden de grenzen van parafraseren op? Is bovenstaand antwoord van Perplexity over het standpunt van Hijink op grond van zijn NRC-artikel schending van auteursrecht? En als ik dit overneem in dit artikel, schend ik rechten van NRC? Of van Perplexity als die nieuwe teksten genereert? Zijn journalisten eerlijk met hun gebruik van AI en bronnen zoals buitenlandse kranten?

Perplexity – en straks Google – nemen het werk van journalisten deels over, maar die gebruiken op hun beurt deze diensten intensief. Als het gebruiken van tekst en beeld binnen de – deels ongeschreven - regels van het citaatrecht zal worden toegestaan, dan zijn de nieuwe AI-zoekdiensten concurrenten van journalistiek en uitgevers. Immers, ze gaan direct met bronnen aan de slag die journalisten aanboren.

AI kan zelfs individueel gaan communiceren met bronnen zoals, wetenschappers, onderzoekers, experts, show- en sportmensen; zeker als die merken dat ze beter worden geciteerd en in een eerlijke context geplaatst dan veelal eigengereide journalisten dat doen.

Fusie tussen media en AI

Dat gaat ten koste van de democratie, roepen journalisten. Dat is nog maar de vraag, als je ziet hoe beroerd nu aan politieke verslaggeving wordt gedaan, met de nadruk op #ophef. Wie dit weekend de ochtenkranten leest, stuit op voorspelbare kritiek op sommige regeringspartijen. Die kleurt onze perceptie sterk in de mediacratie. Over het werkelijk parlementair handelen, lees je veel minder dan over #ophef.

Redacties nemen voorschotten op de ellende met het nieuwe kabinet zonder dat dit nog één handeling heeft verricht, zonder onderzoek te verrichten. Journalistiek lijkt meer en meer 'framing' te worden zonder dat daarvoor verantwoording wordt afgelegd. Dan doet waarschijnlijk AI het met het weergeven van de debatten in parlementen al snel beter dan Haagse parlementaire journalistiek. Als AI meer inhoud dan #ophef biedt gaat het weer over de inhoud, waar de democratie mee gediend kan zijn.

Aan de andere kant zou journalistiek, hoe meer kletskoek AI genereert, juist grotere toegevoegde waarde bieden. Een enorme berg door AI gegenereerde desinformatie noopt een toevlucht tot journalistiek om te weten wat er nog waar is. (Leuke vraag met Perplexity en andere AI-zoekdiensten: wat is nou erger, een juist antwoord waarmee rechten worden geschonden, of bullshitting vanuit een foutieve weergave?)

Het is evident dat uitgevers een deel van hun journalisten kan vervangen door AI, waarbij meer en meer tekst en beeld (grafieken bijvoorbeeld) door AI wordt gegenereerd en door journalistiek wordt aangescherpt en van context voorzien.

Ik denk dat uiteindelijk media en AI tot een nieuw evenwicht zullen komen in samenwerking, met passende verdienmodellen. AI-aanbieders en media-exploitanten kunnen zelfs op termijn gaan fuseren, want ze genereren beide relevante informatie voor het publiek.

*) Beeld: redacteur in een open auto verzorgt een rijdende krant in de straten van Parijs met een luidspreker. (1925, bron: Het Geheugen, KB).

Journalistiek botst op rechtenschending en kletskoek van AI

Journalistiek botst op rechtenschending en kletskoek van AI

Wat vinden de experts?

Privacy

Mediakwesties

Intelligence

Technologie

Actuele dossiers

Recente nieuwsbrieven

Nieuwsbrief ontvangen?

Journalistiek botst op rechtenschending en kletskoek van AI

Journalistiek botst op rechtenschending en kletskoek van AI

Dossier

Gepubliceerd

Wat vinden de experts?

Privacy

Mediakwesties

Intelligence

Technologie

Actuele dossiers

Recente nieuwsbrieven

Nieuwsbrief ontvangen?