Google onthult Gemini 1.5 met een waanzinnig contextvenster

Google heeft onlangs Gemini uitgebracht, het krachtigste AI-model. Het haalde snel de rol van Google’s vlaggenschip AI-model in en verving Bard volledig. Hoewel Gemini nog maar twee maanden oud is, heeft Google ons kennis laten maken met Gemini 1.5, de volgende generatie in de AI-technologie van het bedrijf.

Als je de afgelopen weken onder een steen hebt gelegen, dan heb je een kleine opfriscursus nodig. Google Bard is verdwenen; het bedrijf verving het door Gemini. Je hebt er toegang toe via de website en via de officiële app. Als u op zoek bent naar een meer geavanceerde versie van het model, kunt u Gemini Advanced uitproberen. Dit is de chatbot die het Gemini Ultra-model gebruikt.

Dus nu Bard weg is, lijkt het erop dat Google zijn zinnen heeft gezet op het uiteindelijk vervangen van Google Assistant. We weten niet zeker wanneer dit gaat gebeuren, maar we zien al tekenen dat dit gebeurt. Zo kun je nu de Gemini app gebruiken als vervanging voor de Google Assistent op je telefoon.

Google introduceerde Gemini 1.5 met een waanzinnig contextvenster

Omdat het de 1.5-versie van Gemini is, kun je een ervaring verwachten die veel krachtiger is dan versie 1.0. Het bedrijf kondigde dit nieuwe model aan via een Google-blogpost. Zowel de CEO van Google (Sundar Pichai) als de CEO van Google DeepMind (Demis Hassabis) legden uit waarom Gemini 1.5 superieur is aan het eerste model.

Wat is een contextvenster? Wat zijn tokens?

Voordat we ingaan op wat deze iteratie krachtiger maakt, volgt hier een opfrisser over contextvensters en tokens. A teken is een stukje informatie dat door een model kan worden verwerkt. Het kan een gedeelte van een woord zijn, een stukje audio, een stukje video of een stukje afbeelding. Een eenvoudig woord als ‘Broodrooster’ bestaat bijvoorbeeld uit een handvol tokens.

Een model kan slechts een bepaald aantal tokens tegelijk begrijpen. Het aantal tokens dat een model tegelijkertijd kan begrijpen, wordt de contextvenster. Hoe groter het contextvenster, hoe groter uw zoekopdracht kan zijn.

Stel dat u uw collegerapport in Gemini plakt om samen te vatten, en uw rapport is 2.000 woorden lang (laten we zeggen dat dit neerkomt op 5.000 tokens). Zolang het contextvenster groter is dan 5.000 tokens, kan Gemini elk stukje informatie in uw rapport begrijpen.

Gemini 1.5 zou een enorm contextvenster kunnen hebben

De belangrijkste verandering is het enorme contextvenster. Het bedrijf introduceert Gemini 1.5 Pro voor vroege tests en heeft een indrukwekkend contextvenster van 128.000 tokens. Om dat in perspectief te plaatsen: Gemini 1.0 heeft een contextvenster van 32.000. Dat zijn 4x zoveel tokens.

Daar blijft het niet bij, want een kleine groep testers krijgt toegang tot een versie van Gemini 1.5 met een contextvenster van maximaal 1 miljoen tokens. Met zo’n venster kun je hem een roman van 700.000 woorden, 30.000 regels code, 11 uur audio of een uur video geven, en hij zal er elk stukje van begrijpen. Met zoveel tokens kun je de eerste vier boeken van Stephen King’s Dark Tower-serie erin passen. Dat zijn meer dan 609.000 woorden en 2.000 pagina’s.

Google zei zelfs dat het intern tot 10 miljoen tokens had getest, maar dat zal niet snel voor het publiek beschikbaar zijn. Het is in ieder geval geweldig om te zien dat Google zo ver en zo snel de grenzen verlegt met AI-technologie.

Andere verbeteringen

Naast het grotere contextvenster kun je andere verbeteringen verwachten, zoals beter redeneren, betere leervaardigheden, betere ethiek en nog veel meer. De blogpost gaat er veel dieper op in. Dus als je een AI-liefhebber bent, dan wil je de blogpost lezen. Het gaat dieper in op wat dit AI-model aandrijft.

Lees de blogpost