De grootste AI-aankondigingen tijdens Google I/O 2024

Het verraste niemand: Google kondigde tijdens de eerste dag van Google I/O een heleboel AI-goodies aan. De show is nu helemaal afgerond, maar we zijn allemaal nog steeds aan het bijkomen van de ongelooflijke aankondigingen die Google heeft gedaan. Ongetwijfeld is 2024 een groot jaar geweest voor Gemini, en deze aankondiging benadrukt dat feit alleen maar. Wat waren de grootste AI-aankondigingen tijdens Google I/O? Hier is een overzicht.

Voordat we beginnen: als je een overzicht wilt van meer aankondigingen, zowel grote als kleine, bekijk dan onze Google I/O-samenvatting. Het duikt in de kern van wat het bedrijf heeft aangekondigd.

Grootste AI-aankondigingen tijdens Google I/O 2024

Als we elke AI-aankondiging van het bedrijf opsommen, zal dit artikel zo lang zijn dat je het tot Google I/O 2025 zou lezen! Daarom zetten we de meest baanbrekende aankondigingen op een rij die Google ons heeft gegeven. Dit zijn functies die algemeen beschikbaar zullen zijn voor mensen en die een aanzienlijke impact zullen hebben op de manier waarop u Google-producten gebruikt, de productiviteit verhoogt of welke combinatie dan ook.

Gemini 1.5 Pro/Flash

Vanaf de aankondiging liet Google ons kennismaken met het nieuwste model genaamd Gemini 1.5 Pro. Dit is het meest geavanceerde model van het bedrijf en wordt uitgerold naar verschillende door AI aangedreven producten van het bedrijf.

Gemini 1.5 Pro verbetert de oudere versie van Gemini op alle belangrijke gebieden. Het verwerkt sneller, is slimmer en veel krachtiger. Het meest opvallende eraan is het uitgebreide contextvenster. Gemini 1.5 Pro kan maximaal een miljoen tokens accepteren. Dat is ongehoord en het betekent dat het per prompt veel meer informatie kan opnemen. We hebben het over een hele boekenreeks aan tekst, uren aan audio, een volledig uur aan video, enz. Stel je voor dat je een hele podcast uploadt en een beknopte samenvatting krijgt van wat er is besproken. Daarnaast test Google ook een versie van 2 miljoen tokens van Gemini 1.5 Pro.

Daarnaast heeft Google ook Gemini 1.5 Flash aangekondigd. Dit is eigenlijk een uitgeklede versie van Gemini 1.5 Pro. Het is sneller, compacter en efficiënter. Hoe het ook zij, het heeft nog steeds die limiet van 1 miljoen tokens.

AI-toevoegingen aan de Gmail-app

Gmail is een van de populairste e-mailclients ter wereld, en Google heeft het zojuist een stuk beter gemaakt met een geweldige Gemini-integratie. Ten eerste krijgt Gmail een Summarize-functie. Dit is eenvoudig. Als u langdurig e-mails ontvangt en geen zin heeft om ze allemaal door te lezen, kunt u de samenvattingsfunctie gebruiken om een ​​beknopte en gemakkelijk leesbare samenvatting van alle e-mails te krijgen. Als u alle details van de e-mailthread wilt zien, kunt u uiteraard de e-mails doorlezen. In de meeste gevallen is het echter voldoende om een ​​snel overzicht van alles te krijgen.

Gratis gebruikers zullen teleurgesteld zijn, omdat je deze functie alleen kunt gebruiken als je Workspace-klant bent of het Google One AI Premium-abonnement gebruikt.

Een andere geweldige functie is de Gmail Q&A-functie. Hiermee kunt u Gemini-vragen stellen over de inhoud van e-mailthreads. Dan kan Gemini deze vragen voor u beantwoorden. Als u een heen-en-weer gesprek voert over het vergelijken van huizenprijzen, kunt u Gemini iets vragen als: “Welke potentiële koper heeft mij het beste bod gegeven?” Gemini zou die vraag voor je moeten kunnen beantwoorden.

Vraag Google-foto's

Op dit moment heeft Google Photos een behoorlijk krankzinnige AI, maar dat betekent niet dat het bedrijf deze niet kan verbeteren. Met Gemini is de kunstmatige intelligentie die Google Foto's aandrijft nu veel geavanceerder.

Het bedrijf heeft de functie Ask Photos onthuld en deze is behoorlijk indrukwekkend. Kortom, u kunt Gemini bepaalde brede vragen stellen die betrekking kunnen hebben op afbeeldingen en video's die u hebt gemaakt. Google gaf als voorbeeld hoe een kind door de jaren heen verbeterde met zwemmen. Gemini kan door uw foto's kijken, het kind identificeren, alle foto's en video's van het zwemmen identificeren en u een tijdlijn geven van hoe ze zich ontwikkelden. Dat is slechts één voorbeeld van het nut van deze functie.

Deze optie wordt vastgezet in de onderste balk van de Google Foto's-app.

Project Astra

Dit is een buitengewoon indrukwekkende showcase van de kracht van Gemini. Tijdens de presentatie liet het bedrijf Project Astra zien, een tool die Gemini een paar ogen geeft. Google zal dit op enig moment in de Gemini-app implementeren.

Wanneer je de functie activeert, zie je in de app een zoeker. Gemini kan identificeren wat zich in de zoeker bevindt. In een voorbeeld dat Google gaf, vroeg een Google-ingenieur aan Gemini welk item op hun bureau geluid maakt. De ingenieur wees vervolgens naar een luidspreker en Gemini kon vaststellen dat de luidspreker geluid maakte. Ook tekenden ze een pijl op het scherm die naar de tweeter van de luidspreker wees. Nadat de ingenieur had gevraagd wat dat was, kon Gemini identificeren dat het de tweeter van de luidspreker was en beschreef wat het was.

Dat is slechts één voorbeeld. De ingenieur kon Gemini ook hun locatie laten identificeren door de camera naar buiten te richten. Gemini kon identificeren in welk deel van de stad ze zich bevonden.

Omdat we het over Gemini hebben, kun je vrijwel alles vragen wat je wilt. Je kunt hem vragen stellen over items die zich in de zoeker bevinden, hem vragen om op basis daarvan inhoud te maken, enz.

Het bedrijf verklaarde dat sommige functies van Project Astra later dit jaar naar de Gemini-app zouden komen. We hebben echter geen idee wat die functies zijn, dus we zullen moeten wachten.

Afbeelding 3

Voor het geval u het niet weet: alle afbeeldingen die met Gemini zijn gegenereerd, gebruiken het eigen afbeeldingsmodel van Google, Imagen genaamd. Welnu, het bedrijf heeft Imagen 3 onthuld, het meest geavanceerde model. Hiermee kunnen mensen veel realistischere afbeeldingen produceren waaraan fijne details zijn toegevoegd. Dus als je bezig bent met het genereren van AI-afbeeldingen, dan is dit iets om enthousiast over te zijn. Het streeft naar fotorealisme en bereikt dit.

Veo

Om nog verder te gaan, introduceerde Google ook zijn videogeneratieplatform. Dit gaat mensen herinneren aan OpenAI's videogeneratieplatform genaamd Sora. Sora is in staat een aantal zeer realistisch ogende videoclips te maken.

Tijdens Google I/O onthulde het bedrijf zijn eigen kijk op het genereren van video. Dit is een platform dat verbluffend realistische videoclips kan maken. Het is in staat om 1080p-clips van hoge kwaliteit te maken die verder gaan dan Sora's limiet van 60 seconden. Op dit moment weten we nog niet zeker wanneer het voor het publiek zal verschijnen. Wanneer dit echter het geval is, zijn we er zeker van dat we veel door AI gegenereerde video's op internet zullen zien.

Videovragen voor Google Zoeken

Beschouw deze functie als Google Lens voor video's. U kunt een opname naar Google sturen en Gemini-vragen stellen over die video. De vraag kan over van alles gaan. Gemini kan identificeren wat er in de video gebeurt en op basis daarvan de vraag beantwoorden.

Google gaf tijdens Google I/O een voorbeeld waarbij de presentator Google een vraag stelde op basis van een video van een kapotte draaitafel. Gemini kon vaststellen welk onderdeel van de draaitafel kapot was en gaf haar informatie over wat ze moest doen om het te repareren. Deze functie komt overeen met de oorspronkelijke visie van Google om Gemini te laten redeneren via tekst, audio, video en afbeeldingen.

De mogelijkheden zijn eindeloos met deze functie, en het zal Google veel toegankelijker maken voor mensen die een vraag niet helemaal kunnen typen.

Edelstenen

Deze nieuwe functie is een geweldige manier om uw Gemini-ervaring aan te passen. Een Gem is een gepersonaliseerde versie van Gemini die je om heel specifieke redenen kunt gebruiken. Als je bijvoorbeeld een aangepaste versie van Gemini wilt maken die speciaal is afgestemd om spookverhalen te creëren, kun je daarvoor een juweeltje maken.

In de Gem Creator kun je beschrijven wat voor soort chatbot je wilt maken. Je kunt zoiets typen als 'Een maker van spookverhalen die verhalen maakt met mysterieuze personages en plotwendingen.' Wanneer je dat doet, gaat Gemini aan de slag met het maken van de instructieset voor die chatbot.

Het gaat verder dan dat, want u kunt Gemini ook toegang geven tot uw bestanden in andere Google-producten. Als u Gemini bijvoorbeeld toegang geeft tot uw Google-documenten en u conceptversies van spookverhalen heeft, kan Gemini die conceptversies doorlezen om een ​​idee te krijgen van wat voor soort verhalen u wilt schrijven.

Je kunt meerdere edelstenen maken, dus je kunt ze om verschillende redenen gebruiken. Deze functie wordt later dit jaar uitgerold.

Gemini-aangedreven zwendeloproepdetector

Dit is een leuke functie als u uzelf wilt beschermen tegen oplichting. We zijn er allemaal aan gewend om oplichtingsmeldingen te ontvangen zodra er een oproep binnenkomt. Sommige oproepen komen echter wel door en Google kan u tijdens een oproep waarschuwen als er sprake is van oplichting.

Gemini kan naar uw oproep luisteren en vaststellen of de persoon die u belt, u op de een of andere manier probeert op te lichten. Als u bijvoorbeeld wordt gebeld door een bank en de bank u vraagt ​​uw geld over te maken naar een beveiligde rekening (wat banken NOOIT doen), kan Gemini dat telefoontje markeren en u vertellen dat het waarschijnlijk een scam.

Het mooie hiervan is het feit dat alle verwerking op het apparaat plaatsvindt. U hoeft zich dus geen zorgen te maken dat Google uw gesprek afluistert. Alle gegevens blijven lokaal op uw apparaat opgeslagen.

Notebook LM-upgrade

Notebook LM is een educatief hulpmiddel waarmee kinderen kunnen leren en onderzoeken. Het werd aangekondigd tijdens Google I/O in 2023. Nu krijgt Notebook LM een behoorlijk grote update.

Deze functie wordt audiooverzichten genoemd. Het leest het materiaal dat u erop laadt door en komt met een educatieve discussie die daarop is gebaseerd. Het leerzame gesprek vindt plaats in een podcast Stijl waarbij twee mensen aan het woord zijn. Het zal een echt gesprek nabootsen, zodat kinderen zich er beter mee kunnen associëren.

Niet alleen dat, maar u kunt ook wijzigingen in de discussie voorstellen, en Gemini zal de wijzigingen in realtime doorvoeren. Als u bijvoorbeeld een discussie over de manen van Jupiter maakt, maar deze wilt wijzigen zodat er basketbal-analogieën worden gebruikt, kunt u dat typen. Daarna zal Gemini de onderwijsdiscussie daarop reconstrueren.

Nauwere integratie tussen Workspace-apps

Op dit moment kunnen de Workspace-applicaties van Google, zoals Documenten, Spreadsheets, Presentaties, Gmail, etc. met elkaar integreren. Google verscherpt die integratie echter, en Gemini is de bankschroef die wordt gebruikt om deze aan te scherpen. U kunt Gemini vragen bepaalde acties uit te voeren met uw bestanden binnen Workspace.

Als u bijvoorbeeld wilt dat Gemini uw e-mails bekijkt, een factuur bekijkt voor een dienst die u heeft geleverd en de informatie van die factuur in een Google-document plakt, kunt u dat doen. Dat is slechts één voorbeeld van deze nauwe integratie.

Thijs Van der Does