OpenAI's tekst-naar-video-model Sora is zowel indrukwekkend als eng, afhankelijk van het perspectief. Het kan u helpen uw ideeën om te zetten in een videoclip, zelfs zonder camera. Maar het kan ook die banen wegnemen. Voor degenen die er niet bekend mee zijn: het kunstmatige-intelligentiemodel genereert videoclips van wel een minuut lang op basis van eenvoudige tekstbeschrijvingen.
De door Microsoft gesteunde startup heeft zojuist de eerste grote muziekvideo uitgebracht die door Sora is gegenereerd. Belangrijk is dat het model zich nog in de testfase bevindt en nog niet beschikbaar is voor het publiek. Er is dus nog steeds ruimte voor verbetering op verschillende aspecten.
Heeft OpenAI Sora getraind op YouTube-video's?
Vorige maand heeft de CEO van YouTube OpenAI al gewaarschuwd om zijn video's niet te gebruiken om Sora te trainen. In een recenter interview op de Bloomberg Technology Summit sprak COO Brad Lightcap over mogelijke zakelijke toepassingen van hun AI-producten. Sora, een van de opvallende producten van de startup met potentiële zakelijke toepassingen, verscheen ook in het gesprek. Over Sora gesproken, de interviewer stelde de vraag: “Welke trainingsgegevens zijn gebruikt om het model te trainen?”
Meer specifiek drong de interviewer er bij de OpenAI-functionaris op aan om definitief duidelijk te maken of ze Sora hadden getraind op YouTube-video's. Lightcap leek echter terughoudend om een direct antwoord te geven. In plaats daarvan besprak hij verschillende aspecten, waaronder het genereren van inhoud, het gebruik van deze inhoud als gegevens voor modeltraining, het garanderen van transparantie met betrekking tot gegevensgebruik, potentiële voordelen voor makers van inhoud, en meer. Hij noemde YouTube echter geen enkele keer in zijn beschrijvende “non-antwoord” op de vraag of OpenAI Sora heeft getraind op video’s van het platform of niet.
COO Brad Lightcap weigerde de vraag te beantwoorden
“Dus ja, we kijken naar dit probleem, het is echt moeilijk. We hebben nog niet alle antwoorden”, eindigde hij. OpenAI heeft inderdaad wat informatie gedeeld over “het begrijpen van de bron van wat we online zien en horen.” Het ging echter vooral om de authenticiteit van de inhoud en hoe ze de transparantie over de bron van de inhoud willen behouden. In de post werd echter niet echt gesproken over de gegevens die ze hebben gebruikt of gebruiken om de taalmodellen te trainen. Om nog maar te zwijgen van het feit dat er ook niet werd gesproken over het gebruik van inhoud van YouTube.
Ter herinnering: de CTO van het bedrijf, Mira Murati, kreeg eerder vorige maand ook dezelfde vraag over Sora. Ook zij kon geen duidelijk antwoord geven op de vraag.
Volgens rapporten van eerder dit jaar gebruikte OpenAI YouTube-video's om GPT-4 te trainen, wat in strijd is met de platformregels. Maar Google deed naar verluidt ook hetzelfde. Over de trainingsgegevens van Sora gesproken: het ingewikkelde niet-antwoord duidt op de mogelijkheid van het gebruik van YouTube-video's. Het model zou in de tweede helft van 2024, mogelijk in augustus, voor het publiek kunnen worden vrijgegeven.