GPT-4o versloeg Gemini 1.5 Pro in een vergelijking

Op dit moment zijn er twee extreem krachtige AI-modellen op de markt, en dat zijn OpenAI's GPT-4o en Google's Gemini 1.5 Pro. Beiden werden vorige week tentoongesteld en ze lieten allebei een aantal ongelooflijke AI-slimheid zien. Als we echter in het onkruid graven, blijkt dat de één slimmer is dan de ander. Na een vergelijking versloeg GPT-4o Gemini 1.5 Pro met afstand.

Afgelopen maandag organiseerde OpenAI zijn voorjaarsevenement waar het enkele nieuwe updates voor ChatGPT aankondigde. Tijdens het evenement toonde het bedrijf GPT-4o. Dit is het krachtigste AI-model dat het bedrijf tot nu toe heeft, en het zal beschikbaar zijn voor zowel gratis als betaalde gebruikers. Het bevat multimodale invoer, een uiterst realistische stem en meer functies.

De volgende dag onthulde Google Gemini 1.5 Pro. Dit is het krachtigste model van het bedrijf en drijft de AI aan in verschillende Google-producten. Daarnaast zagen we functies als Project Astra en een heleboel handige tools naar Google Workspace komen.

GPT-4o versloeg Gemini 1.5 Pro in een vergelijking

De mensen bij Beebom hebben een vergelijking gemaakt tussen de krachtigste modellen van Google en OpenAI. Tijdens de test vroegen ze beide modellen om specifieke taken uit te voeren en specifieke vragen te beantwoorden. Dit waren fundamentele redeneervragen die het begrip van logica en redeneren door de modellen testten. Eén vraag die werd gesteld was bijvoorbeeld: “Er zit een mand zonder bodem in een doos, die op de grond staat. Ik legde drie appels in de mand en zette de mand op een tafel. Waar zijn de appels?”

Daarnaast vroeg Beebom beide modellen om te beschrijven wat er in een afbeelding staat, tekst te herkennen en zelfs een spel te maken. De resultaten? Nou, als je hoopte dat Gemini 1.5 Pro hetzelfde speelniveau zou hebben als GPT-4o, zul je erg teleurgesteld zijn. Van de acht tests versloeg GPT-4o Gemini Pro in zes ervan.

De twee tests die GPT-4o niet won, waren nog steeds geen overwinningen voor Gemini 1.5 Pro. In de ene test (een logische test) hadden beide modellen gelijk, en in de andere (de beeldtest) won geen van beide modellen.

Dit laat alleen maar zien dat, hoewel Gemini tijdens Google I/O blijk gaf van een ongelooflijk waanzinnige AI-vaardigheid, het op bepaalde gebieden nog steeds achter GPT-4o staat.