Er zijn verschillende modellen die AI een paar ogen geven, en het PaliGemma-model van Google is daar een van. Dit is het visietaalmodel van het bedrijf dat objecten en tekst in afbeeldingen kan identificeren. Google heeft zojuist het nieuwe PaliGemma 2-model gelanceerd en kan nu worden gebruikt.
Het eerste PaliGemma-model is een nuttig hulpmiddel. Het is handig voor het identificeren van objecten in afbeeldingen en voor het ondertitelen van afbeeldingen. Het kan zelfs korte video’s ondertitelen. Een van de handigere functies van PaliGemma is de mogelijkheid om vragen over afbeeldingen te beantwoorden. Het is dus een algeheel krachtig model met veel gebruiksmogelijkheden.
Google heeft het nieuwe PaliGemma 2-model aangekondigd
Google heeft ons in mei officieel kennis laten maken met het PaliGemma-model. Het bedrijf is van plan PaliGemma 2 te gebruiken als drop-in vervanging voor het eerste model. Dus als u PaliGemma versie 1 gebruikt, wordt u aangemoedigd om over te schakelen.
Google biedt PaliGemma 2 in verschillende smaken aan. Er zijn de 3 miljard, 10 miljard en 28 miljard parametervarianten. Er zijn ook resoluties van 224 pixels, 448 pixels en 896 pixels.
Wat de andere specificaties betreft, beschikt PaliGemma 2 over lange ondertiteling. Google zegt ook dat het verder gaat dan alleen het identificeren van objecten. Het lijkt erop dat het model in staat zal zijn mensen te identificeren en hun emoties te interpreteren. Dus als een persoon blij, verdrietig, etc. is, dan kan PaliGemma 2 dat oppikken.
Het lijkt er ook op dat het model meer zal identificeren van wat er in de scène gebeurt om het hele verhaal te vertellen. Google zegt dat PaliGemma beter is als het gaat om het herkennen van muziekpartituren, het herkennen van chemische formules, het identificeren van diepte en het maken van röntgenfoto’s van de borstkas.
Over het geheel genomen lijkt het erop dat Google een aantal behoorlijk opmerkelijke updates voor PaliGemma heeft geleverd. Als je het wilt gebruiken, kun je de code ervoor krijgen in Hugging Face, Kaggle en Ollama.
Er is nog een groot model van Google
Google heeft ook de privépreview uitgebracht voor zijn videogeneratiemodel genaamd Veo. Het bedrijf kondigde het dit jaar aan tijdens Google I/O en mensen hebben er op gewacht. Als u het Vertex-cloudplatform van Google gebruikt, kunt u het uitproberen. U kunt video’s genereren met een resolutie tot 1080p.