De EU is een onderzoek gestart naar de manier waarop Google zijn model heeft getraind

Wat nu net zo belangrijk is als de AI die onze wereld aandrijft, is hoe AI-modellen worden getraind. We weten allemaal dat deze AI-modellen moeten worden getraind op een hoop data. Het probleem is dat veel van deze data zonder toestemming is verkregen. Volgens een nieuw rapport is de EU een onderzoek gestart naar Google om te zien of het illegaal data heeft verkregen om zijn model te trainen.

Het onderwerp dataprivacy is behoorlijk hot, aangezien grote bedrijven de basiswetten voor privacy blijven negeren. Het is niet te zeggen hoeveel data deze bedrijven illegaal hebben verkregen. Zo heeft Meta onlangs toegegeven dat het al in 2007 (toen het nog Facebook heette) data van Australiërs heeft gescrapt.

De EU is een onderzoek gestart naar Google vanwege zijn AI-model

We zijn er allemaal vrij zeker van dat de meeste data die Gemini aandrijven illegaal is verkregen, maar dit onderzoek gaat niet over Gemini, aangezien Google andere modellen heeft. De in Ierland gevestigde DPC (Data Protection Commission) uitte zijn bezorgdheid over de manier waarop Google zijn Pathways Language Model 2 of PaALM 2 heeft getraind. Dit is een basismodel dat in mei 2023 werd geïntroduceerd.

De commissie wil weten of Google de privacy van EU-burgers heeft gerespecteerd bij het trainen van het model.Dit wettelijke onderzoek maakt deel uit van de bredere inspanningen van de DPC, die samenwerkt met haar EU/EER (Europese Economische Ruimte)-toezichthouders, bij het reguleren van de verwerking van persoonsgegevens van EU/EER-onderdanen bij de ontwikkeling van AI-modellen en -systemen.“, stond er.

Dit is een terechte zorg. Naarmate de tijd verstrijkt, worden deze modellen sterker, omdat de bedrijven erachter racen om ze de beste op de markt te maken. Het probleem is echter dat bedrijven naarmate de tijd verstrijkt meer data verzamelen. We hadden wetten voor gegevensbescherming van kracht, maar pas tijdens de generatieve AI-hausse realiseerden we ons hoeveel data er dagelijks werd verzameld.

Op dit moment is dit slechts een onderzoek, dus het is geen indicatie van een rechtszaak of juridische actie. Mocht het echter gebeuren dat Google illegaal informatie heeft verkregen, dan kunnen we verwachten dat er juridische stappen zullen volgen.

Thijs Van der Does