Google Bard gaat Imagen adopteren als tool voor het genereren van afbeeldingen

Google breidt zijn generatieve AI-aanbod uit met een aanstaande afbeeldingsgenerator voor Google Bard, zoals onthuld in een nog niet uitgebrachte changelog van 18 januari.

In navolging van tools als Search Generative Experience (SGE) en Slides kunnen gebruikers afbeeldingen maken door een paar woorden in te voeren die de afbeelding beschrijven. Deze nieuwe mogelijkheid zal naar verwachting worden mogelijk gemaakt door de Imagen-modellenfamilie van Google. Imagen staat bekend om hun vermogen om fotorealistische afbeeldingen van hoge kwaliteit te produceren.

In december introduceerde Google Imagen 2, met een aanzienlijk verbeterde beeldkwaliteit. De technologie is gericht op zakelijke gebruiksscenario’s, zoals het genereren van logo’s of het maken van afbeeldingen met tekstoverlays.

De beeldgenerator van Google Bard zal naar verwachting veiligheidskenmerken volgen die vergelijkbaar zijn met die in SGE. Met dit laatste, dat in oktober werd geïntroduceerd, kunnen gebruikers prompts rechtstreeks in het zoekveld ’tekenen’ of ‘schetsen’, waardoor vier afbeeldingen tegelijk worden gegenereerd.

Net als SGE zal Google Bard ook resultaten met opmerkelijke mensen en expliciete inhoud blokkeren

SGE garandeert de veiligheid door het genereren van schadelijke, misleidende of expliciete inhoud te blokkeren. Bard zal ook aanwijzingen met opmerkelijke mensen of fotorealistische gezichten beperken, meldt 9to5Google. Bovendien krijgt elke gegenereerde afbeelding een metadata-label en onzichtbare watermerken met behulp van Google’s SynthID.

Google Slides en Meet, de laatste voor aangepaste achtergronden, bevatten al gebruikersgerichte beeldgeneratie via Duet AI. De aanstaande toevoeging van een beeldgenerator aan Bard breidt de toegankelijkheid van door AI gegenereerde inhoud uit via verschillende Google-services.

Door verdere beschrijvingen toe te voegen aan de bijschriften van afbeeldingen in de trainingsdataset van Imagen 2, verbetert Google het begrip van de bijschriften van afbeeldingen. Het zal een nauwkeurigere en contextueel genuanceerdere beeldgeneratie mogelijk maken.

Bovendien pakt Imagen 2 veelvoorkomende uitdagingen aan waarmee tekst-naar-beeld-tools te maken hebben, zoals het weergeven van realistische handen en menselijke gezichten. De technologie omvat een gespecialiseerd model voor beeldesthetiek. Het is gebaseerd op menselijke voorkeuren en zorgt ervoor dat de gegenereerde afbeeldingen aansluiten bij de eigenschappen die de gebruikers prefereren. Deze verbeteringen dragen gezamenlijk bij aan het verbeterde vermogen van Imagen 2 om hoogwaardige en realistische afbeeldingen te genereren.

De stap sluit aan bij de bredere strategie van Google om geavanceerde AI-technologieën te integreren in zijn dienstenpakket.