De VASA-1 van Microsoft kan levensechte pratende gezichten creëren

Op dit moment is het veilig om te zeggen dat de AI-technologie zich in een snel tempo ontwikkelt. Microsoft is een van de toonaangevende bedrijven op het gebied van AI met behulp van OpenAI. Welnu, de nieuwste tool van Microsoft heet VASA-1, een krachtig hulpmiddel om levensechte pratende gezichten te genereren die in realtime werken.

Dit is een bewijs van het groeiende vermogen van AI om mensen na te bootsen op basis van minimale input. TikTok werkt bijvoorbeeld aan een tool waarmee mensen met slechts 10 seconden audio-invoer een door AI gegenereerde kloon van hun stem kunnen maken. Op het moment dat dit artikel wordt geschreven, is deze tool niet beschikbaar voor het publiek. We verwachten echter dat deze relatief snel uitkomt.

Met de VASA-1 van Microsoft kunnen gebruikers in realtime levensechte pratende gezichten creëren

We hebben hiervan voorbeelden gezien in honderden advertenties van apps waarmee je een portret kunt animeren, zodat het lijkt alsof je een liedje van Billie Eilish zingt. De technologie achter VASA-1 is echter veel geavanceerder en veel verfijnder. U kunt voor deze tool één enkele afbeelding gebruiken. Met behulp van deze afbeelding kan de tool realistische bewegingen genereren, zodat het lijkt alsof de persoon aan het woord is.

Dat is al indrukwekkend, maar het gaat verder dan dat. VASA-1 kan subtiele gezichtsbewegingen creëren en een breed scala aan emoties overbrengen. Dit is iets dat door de jaren heen bij vergelijkbare tools ontbrak. De belangrijkste focus ligt op realisme, en het komt daar heel dichtbij.

Het bedrijf toonde een paar voorbeelden van deze technologie op zijn website, en het is zeer indrukwekkend. Afgezien daarvan kunnen pratende gezichten in realtime lipsynchroniseren met audio. Dat is nog een geweldige kwaliteit van deze tool.

Microsoft VASA-1 kan 512×512 video's genereren met maximaal 40FPS. Bovendien beschikt Microsoft in de online streaming-modus over een latentie van slechts 170 ms.

Op dit moment weten we niet wanneer Microsoft van plan is deze functie aan het grote publiek vrij te geven. Wanneer dit echter het geval is, zijn we er vrij zeker van dat Microsoft er inkomsten mee zal genereren. Het zou mogelijk een functie kunnen zijn in een van de abonnementsdiensten van het bedrijf. Om het zeker te weten zullen we moeten wachten tot het uitkomt.

Thijs Van der Does