Gegevensgebruik blijft een controversieel onderwerp in de wereld van kunstmatige intelligentie. In een poging om de wateren te kalmeren, hebben grote spelers in de industrie deals gesloten met sociale of inhoudsplatforms. Een dergelijk geval is het partnerschap tussen Reddit en Google. Nu, in een gerelateerde ontwikkeling, is Reddit in discussie met Google om de content-sharing-overeenkomst voor AI-training te herzien, die oorspronkelijk meer dan een jaar geleden werd opgericht voor een gerapporteerde $ 60 miljoen per jaar.
De gesprekken tussen de twee bedrijven richten zich op twee belangrijke gebieden (gerapporteerd door Bloomberg). Ten eerste, volgens rapporten, stelt Reddit een nieuwe dealstructuur voor die weg zou gaan van een vaste betaling en naar een dynamisch prijsmodel. Onder dit model zou de compensatie van Reddit worden bepaald door hoe vaak de inhoud ervan wordt aangehaald of gebruikt als een bron voor antwoorden die worden gegenereerd door AI -platforms zoals Google’s AI -overzichten. Reddit -leidinggevenden geloven dat de huidige voorwaarden de waarde van hun gegevens niet voldoende weerspiegelen aan AI -bedrijven.
Reddit wil een AI -deal met Google die hen meer verkeer en gebruikers geeft
Ten tweede is Reddit op zoek naar een ander soort partnerschap dat meer van het verkeer zou aanmoedigen dat het van Google ontvangt om in actieve leden van de gemeenschap te converteren. Deze inspanning is bedoeld om een uitdaging aan te gaan in de huidige relatie: gebruikers die antwoorden van Reddit -inhoud op Google vinden, bezoeken vaak het platform zelf niet. Dit beperkt het vermogen van Reddit om zijn gebruikersbestand te laten groeien en nieuwe inhoud te genereren voor toekomstige AI -training. Door een manier te vinden om gebruikersbetrokkenheid te verdiepen, kan het partnerschap een meer consistente bron van hoogwaardige gegevens voor AI-modellen bieden.
De discussies vinden plaats omdat de gegevens van Reddit een waardevolle bron zijn voor AI -bedrijven. Grote taalmodellen krijgen enorme datasets van internet geschraapt. Het unieke formaat van Reddit, met zijn diepgaande, gebruikersgestuurde gesprekken over een breed scala aan onderwerpen, is een vaak geciteerde bron. Gegevens suggereren dat Reddit het meest geciteerde domein is voor AI -tools zoals Pertlexity en Google’s eigen AI -overzichten.
Andere uitgevers en platforms die een eerlijke vergoeding zoeken
Deze situatie is niet exclusief voor Reddit. Andere contentproviders, waaronder nieuwsuitgevers, hebben ook aangepakt hoe hun werk wordt gebruikt om AI -modellen te trainen. De New York Times heeft bijvoorbeeld zowel Openai als Google aangeklaagd. Het mediaplatform beweert dat zijn werk onjuist werd gebruikt. In een vergelijkbaar geval heeft Reddit ook de opening -rivaal antropisch aangeklaagd. In dit geval beweerde het sociale mediaplatform dat de AI -startup zijn gegevens illegaal heeft geschraapt om zijn modellen te trainen.
De uitkomst van de Reddit- en Google -gesprekken is nog steeds in behandeling. De discussies benadrukken echter hoe contentplatforms nieuwe manieren willen vaststellen om een eerlijke vergoeding voor hun inhoud te krijgen.