Google Gemini kan nu naar audiobestanden luisteren

Op dit moment ontwikkelt de technologie zich in een snel tempo en kunnen AI-modellen verschillende soorten media identificeren. Welnu, Google heeft zojuist aangekondigd dat zijn nieuwe AI-model, Gemini 1.5 Pro, nu audio begrijpt. Dit nieuws komt kort nadat Google Gemini in Android Studio heeft aangekondigd.

Om AI-modellen te kunnen leren, moeten ze een hoop data krijgen. Aanvankelijk werden AI-modellen vooral getraind op tekstgebaseerde data. Dit is vooral belangrijk voor chatbots. Naarmate de tijd verstreek, kregen ze echter de mogelijkheid om beeldgegevens te verwerken. Verschillende chatbots bieden u de mogelijkheid om uw eigen afbeeldingen te uploaden om deze te reconstrueren of te verifiëren.

Gemini 1.5 Pro kan audiobestanden begrijpen

Toen Google Gemini voor het eerst aan het publiek introduceerde, zei het bedrijf dat het uiteindelijk meerdere vormen van media zou kunnen vaststellen, zoals afbeeldingen, audio en video. Welnu, het is al een tijdje in staat om afbeeldingen vast te stellen, en het bedrijf heeft er zojuist nog een aangevinkt. Gemini 1.5 Pro is het nieuwste AI-model van het bedrijf en wordt momenteel getest. Het leuke aan dit model is dat het eigenlijk nog krachtiger is dan Gemini Ultra. Het bedrijf overtreft zichzelf dus.

Deze nieuwste update geeft het de mogelijkheid om audiobestanden te analyseren en te verwerken. Dus als u een samenvatting wilt van een lange keynote, gesprek, inkomensgesprek, enz., kunt u de audio rechtstreeks naar Gemini uploaden. Hoewel er tools zijn die gesprekken kunnen samenvatten (er zijn zelfs tools beschikbaar op smartphones), is deze implementatie anders. De huidige tools zullen de toespraak in tekst omzetten en vervolgens het gesprek samenvatten op basis van de tekst. Gemini 1.5 kan echter de tussenpersoon uitschakelen en rechtstreeks naar de audio luisteren. Dit zou de nauwkeurigheid mogelijk kunnen vergroten.

Als je deze functionaliteit wilt gebruiken, is er teleurstellend nieuws. Om deze functie te gebruiken, moet u het ontwikkelingsplatform van Google gebruiken, genaamd Vertex AI. U kunt het ook gebruiken als u AI Studio gebruikt. Dus als u wacht op een publieke release, zult u geduld moeten hebben.

Thijs Van der Does