Hoe graag we het ook zouden geven om het toe te geven, er is een duidelijke mogelijkheid dat AI op een dag onze banen zou kunnen aannemen. We zien dit al gebeuren, vooral in de grafische ruimte, waar gebruikers gemakkelijk een professioneel-genoeg afbeelding kunnen genereren met een paar eenvoudige prompts. Maar hoe snel kunnen we verwachten dat AI ons echt zal vervangen in de werkruimte? Dat is iets dat Openai in een recente benchmark wilde ontdekken om te zien hoe goed het GPT-5-model menselijke banen doet.
Openai benchmarks GPT-5 tegen menselijke banen
Deze nieuwe benchmark wordt GDPVal genoemd. Volgens OpenAI meet het AI-modellen zoals GPT-5 op taken die een mens zou kunnen doen bij hun werk. ‘Het meet modelprestaties op taken die rechtstreeks uit het echte kenniswerk van ervaren professionals in een breed scala aan beroepen en sectoren worden getrokken, en biedt een duidelijker beeld van hoe modellen presteren op economisch waardevolle taken. “
Momenteel is GDPVal gebaseerd op negen industrieën die het meest bijdragen aan het Amerikaanse bbp. Dit omvat gezondheidszorg, financiën, productie en overheid, om er maar een paar te noemen. In een van de tests vroeg Openai professionals in de industrie om rapporten te vergelijken die door AI en die door andere professionals zijn gegenereerd. Het vroeg ook investeringsbankiers om een landschap van concurrent te creëren voor de last-mijl leveringsindustrie en het te vergelijken met AI-gegenereerde rapporten.
Verrassend en enigszins verontrustend heeft het GPT-5-model van Openai het beste uit alle modellen van het bedrijf uitgevoerd. Openai ontdekte dat het werk dat door GPT-5 werd gegenereerd, ofwel beter of op gelijke voet stond met experts uit de industrie 40,6% van de tijd. Het bedrijf keek ook naar zijn concurrent, antropisch, en zijn Claude AI -model. Claude leek beter te presteren met een winstpercentage van 49%. Openai denkt echter dat het komt omdat Claude beter is in het maken van “aangename afbeeldingen. “
Zal dit mensen vervangen door hun werk?
Zoals we al zeiden, is er een mogelijkheid dat sommige banen uiteindelijk de weg van de dinosaurus kunnen gaan. Voor nu lijkt het er echter op dat we ons in een overgangsperiode bevinden. Sprekend met TechCrunch suggereert Openai’s Chief Economist, Dr. Aaron Chatterji, dat het op basis van de GDPVAL -resultaten niet gaat over AI die mensen vervangt. Maar het gaat erover om mensen die AI gebruiken om tijd vrij te maken voor meer betekenisvolle taken.
Uw taak kan bijvoorbeeld vereisen dat u rapporten op basis van gegevens moet typen. In plaats van uren door te brengen met het formatteren van alles, kan AI de klus binnen enkele minuten voor u klaren. Dit zou tijd vrijmaken om aan andere taken op het werk of zelfs persoonlijke taken uit te geven. Klinkt als een eerlijke afweging.