Waymo heeft aangegeven dat het Google Gemini AI gaat gebruiken voor zijn zelfrijdende ‘robotaxis’. Het bedrijf lijkt een nieuw trainingsmodel voor zijn autonome voertuigen te ontwikkelen, dat gegevens zal putten uit het Multimodal Large Language Model (MLLM) Gemini van Google.
Waymo brengt nieuw onderzoekspaper uit over MLLM’s die robotaxis helpen
Waymo LLC was voorheen bekend als het Google Self-Driving Car Project. Het is een Amerikaans technologiebedrijf voor autonoom rijden. Waymo heeft geleidelijk hardware en software gebouwd voor robotaxis om passagiers veilig op drukke wegen te vervoeren.
Waymo heeft een nieuw onderzoeksartikel uitgebracht, zo meldt De rand. Getiteld “End-to-end multimodaal model voor autonoom rijden”of EMMA, verwijst het onderzoekspaper naar een nieuwe MLLM die zich richt op autonome voertuigen.
Dit nieuwe end-to-end trainingsmodel zou sensorgegevens verwerken en “toekomstige trajecten voor autonome voertuigen” genereren. Onnodig te zeggen dat dit de zelfrijdende voertuigen van Waymo zou helpen slimme beslissingen te nemen onderweg. De Waymo-robotaxis kon vol vertrouwen voorspellen waar hij heen moest en hoe hij obstakels kon vermijden.
Hoe gaat Google Gemini Waymo helpen?
Al enkele jaren gebruiken algoritmen voor zelfrijdende voertuigen gecompartimenteerde oplossingen of modules om elke kritieke functie aan te pakken. Met andere woorden: technologiebedrijven probeerden aspecten als perceptie, mapping, voorspelling en planning onafhankelijk van elkaar aan te pakken.
Een dergelijke aanpak heeft geholpen bij het oplossen van problemen voor autonome voertuigen. Met deze aanpak hebben bedrijven echter problemen ondervonden bij het opschalen van hun oplossingen. Dit komt door “opeengehoopte fouten tussen modules en beperkte communicatie tussen modules”, aldus Waymo in het onderzoekspaper.
Bovendien zorgden ‘vooraf gedefinieerde’ parameters ervoor dat dergelijke oplossingen haperden in hun reactie op ‘nieuwe omgevingen’, terwijl ze moeite hadden om zich ‘aan te passen’. Google’s Gemini is een generatieve kunstmatige intelligentie (Gen AI). Het is een ‘generalistische’ AI die de zoekgigant heeft getraind op basis van enorme hoeveelheden verzamelde gegevens van internet.
Ten tweede hebben Gen AI-platforms bewezen ‘superieure’ redeneercapaciteiten te demonstreren door middel van technieken als ‘chain-of-thought redenering’, aldus Waymo. Simpel gezegd: Gemini kan de menselijke redenering nabootsen, en daarom zou de LLM kunnen ‘denken’ als een bestuurder.
Hoewel Google Gemini Waymo zou kunnen helpen, zou de EMMA AI nog steeds leuk moeten spelen met nieuwe gegevens, iets dat autonome voertuigen voortdurend moeten doen. Specifiek gesproken heeft EMMA problemen ondervonden bij het integreren van 3D-sensorinvoer van lidar of radar, gaf Waymo toe.