ShengShu-technologie kwam op de markt met primeurs, zoals Multiple-Entity Consistency, en het eerste commercieel verkrijgbare generatieve videoplatform, Vidu. En het bedrijf maakte vandaag bekend dat het erin is geslaagd om in de eerste 100 dagen 10 miljoen gebruikers te werven. Maar het is nog vroeg en tal van sectorbrede kwesties worden geoormerkt voor verbeteringen. De belangrijkste daarvan zijn snelheid en betaalbaarheid.
Elke keer dat een video wordt gegenereerd, duurt het tientallen seconden of zelfs minuten. Generatieve video in het huidige formaat kan geweldig zijn voor het genereren van beeldmateriaal voor editors of sociale inhoud, maar de meeste bedrijven beschouwen snelheid nu als een nieuwe doos van Pandora voor toepassingen die niet mogelijk zijn zonder verbeteringen in snelheid en kosten. Dit geldt voor de programmatische reclame-industrie, waarvan een groot deel geautomatiseerd is, en zelfs voor nieuwe methoden voor het vertellen van verhalen.
Het bedrijf stelt zich bijvoorbeeld een wereld voor waarin generatieve video kan worden gebruikt om een verhaal te illustreren. Maar dat verhaal is interactief en past zich aan elke beslissing die je neemt aan, zoals Netflix’s Bandersnatch, maar met vrijwel onbeperkte eindes. Als je nieuwsgierig zou zijn naar wat er zou gebeuren als Harry uiteindelijk in Zwadderich zou worden gesorteerd en de kans zou krijgen om de beslissing van de Sorteerhoed te ‘beïnvloeden’, zou generatieve video dat in de toekomst misschien wel mogelijk kunnen maken. Maar om dit te laten gebeuren, is snelheid van essentieel belang.
Dit is waar de Vidu 2.0-technologie van ShengShu Technology in beeld komt. Het is een grote update die misschien wel een mijlpaal is voor de branche. De focus van Vidu 2.0 ligt op snellere output, maar tegen veel lagere kosten voor het genereren van elke videoclip, wat mogelijk is dankzij de baanbrekende technologie, die het een ‘full-stack interferentieversneller’ noemt.
“Vidu 2.0 beschikt over ultrahoge generatiesnelheden en robuuste multimodale contextverwerking, tegen een betaalbare prijs die gemakkelijker dan ooit te gebruiken is. Belangrijker nog is dat dit de hoekstenen zijn die het mogelijk maken dat gebruikers of bedrijven real-time content samen creëren, waardoor ze zich kunnen onderdompelen in en beter contact kunnen maken met hun publiek”, zegt Jiayu Tang, CEO en medeoprichter van ShengShu Technology.
Toegegeven, Vidu 2.0 genereert niet onmiddellijk video’s, maar het bedrijf loopt voorop onder de concurrenten omdat het de tijd die nodig is om clips te genereren terugbrengt tot minder dan 10 seconden. En ze zijn erin geslaagd dit te doen tegen een prijs die 55% goedkoper is dan het sectorgemiddelde.
Om enig licht te werpen op deze benchmarks legt ShengShu Technology uit dat de gemiddelde kosten voor het genereren van een clip in de sector 0,084 dollar per seconde bedragen. Vidu 2.0 is er echter in geslaagd om dat met maar liefst 55% terug te brengen tot slechts $ 0,0375 per seconde. Beter nog, je zou kunnen denken dat als het sneller is, de kwaliteit van de video eronder zou lijden, maar Vidu 2.0 zorgt ervoor dat dat niet gebeurt.
Als onderdeel van de visie achter de Vidu 2.0-update voorziet ShengShu Technology een toekomst waarin tekstprompts (waarvan sommige hun eigen complicaties en kennis hebben om de perfecte uitvoer te krijgen) uiteindelijk plaats zouden kunnen maken voor het genereren van clips met slechts een enkele klik. Dit neemt het giswerk weg bij het proberen om met vallen en opstaan complexe aanwijzingen te genereren.
De aanpak van Vidu 2.0 hiervoor is met een “Sjablonen”-functie waaruit gebruikers kunnen kiezen uit een reeks vooraf ingestelde promptsjablonen. Sjablonen maken het toevoegen van interactieve rekwisieten of complexe acties – zoals bijvoorbeeld proberen twee specifieke mensen uit een menigte van vijf elkaar de hand te laten schudden – aanzienlijk eenvoudiger.