Google DeepMind lanceert tool om door AI gegenereerde tekst te detecteren

In het AI-tijdperk hebben de onderwerpen auteursrecht en inhoudslegitimiteit veel aandacht gekregen. Of het nu gaat om het bepalen of een stuk inhoud is gebruikt met toestemming voor AI-training of dat een realistische afbeelding/video is gegenereerd door kunstmatige intelligentie: tools voor het detecteren van de legitimiteit van inhoud zijn van cruciaal belang in de branche. Google DeepMind heeft nu een tekstgerichte AI-watermerktool geïntroduceerd.

SynthID, de watermerktool van Google DeepMind, gericht op het detecteren van door AI gegenereerde tekst

De nieuwe tool, genaamd SynthID, is ontworpen om tekst te detecteren die is gegenereerd door de Gemini-modellen van Google. DeepMind, de divisie van het bedrijf die zich volledig richtte op op AI gebaseerde ontwikkelingen, stelde het echter open voor externe ontwikkelaars. Dit betekent dat elk AI-gericht extern bedrijf de middelen en API’s van SynthID kan gebruiken om tekstdetectie mogelijk te maken via hun eigen ontwikkelingen.

SynthID sluit zich aan bij vergelijkbare DeepMind-tools die zijn ontwikkeld om door AI gegenereerde afbeeldingen, muziek en video’s te identificeren. Het werkt door kleine wijzigingen aan te brengen in de geanalyseerde tekst om de probabilistische uitvoer van het model te wijzigen. Vervolgens vergelijkt het de originele tekst rechtstreeks met de gewijzigde versie om een uitvoer te verkrijgen. Kortom, het bepaalt hoe waarschijnlijk het is dat een bepaald AI-model (zoals Gemini) bepaalde reeksen woorden, zinnen en alinea’s in de tekst zal genereren.

Google DeepMind beweert dat zijn AI-watermerktool ervoor zorgt dat er niet te veel wijzigingen in de originele tekst worden aangebracht. Een invoer die aanzienlijk afwijkt van de oorspronkelijke invoer, kan de vergelijkingsresultaten mogelijk vertekenen. Het overschrijden van deze fijne lijn kan mogelijk de validiteit van de output beïnvloeden. De AI-divisie van Google beweert het echter onder controle te hebben.

DeepMind-tests om de authenticiteit van de resultaten te garanderen

Om er zeker van te zijn dat SynthID niet te ver ging in het wijzigen van de originele tekstinhoud, voerde DeepMind tests uit met menselijke input. De AI-divisie van Google stuurde ongeveer 20 miljoen tekstpassages gegenereerd door Gemini naar mensen. Sommige personen ontvingen de gegenereerde tekstinhoud in de oorspronkelijke vorm, terwijl anderen dezelfde inhoud ontvingen die door SynthID was aangepast voor de detectietests. Uit de resultaten bleek dat alle tekstpassages, origineel en aangepast, vrijwel niet van elkaar te onderscheiden waren.

Het feit dat SynthID open source is, is geweldig, maar er zijn ook enkele nadelen waarmee rekening moet worden gehouden. Slechte actoren zouden het bijvoorbeeld kunnen gebruiken om te leren hoe ze door AI gegenereerde tools voor het detecteren van inhoud kunnen omzeilen. Ze zouden die kennis kunnen gebruiken om AI-tools te ontwikkelen die tekst genereren die niet detecteerbaar is door tools voor watermerken. Wij gaan er echter vanuit dat DeepMind zich hiervan ook bewust is en voorbereid is.