Poté, co si odbyl svou premiéru na letošní vývojářské konferenci I/O, má být model pro generování obrázků z textu s názvem Imagen 3 od Googlu k dispozici ve všech verzích chatbota Gemini. A to i té zcela základní, dostupné bez poplatku. Dostupný by měl být už dnes během dne, a to ve všech jazycích, včetně češtiny.
Imagen 3 dokáže vytvořit obrázek z pouhých několika slov, přičemž podporuje různé styly od fotorealistických krajin přes texturované olejomalby až po abstraktní umění.
Nástroj také přinese pokročilé schopnosti převodu textu do obrazu za zachování přísných ochranných prvků a pojistek. Pro označení a následné rozpoznání jím vytvořených obrázků využívá vodoznak vygenerovaný technologií SynthID.
V následujících dnech zprovozní Google v Imagenu 3 i možnost vytvářet obrázky osob. Nejprve ve verzi dostupné pro uživatele Gemini Advanced, Business a Enterprise v anglickém jazyce.
Služba prošla technickým vylepšením, včetně zlepšení evaluačních datasetů a množstvím zátěžových testů. Nicméně přesto v ní nebude možné vytvořit fotorealistický obrázek rozpoznatelných osob, zobrazit nezletilé nebo příliš krvavé, násilné či sexuální scény.
V nejbližší době do Gemini Advanced, Business a Enterprise přibude taktéž nová funkce s názvem Gems, která umožňuje uživatelům vytvářet vlastní AI experty na míru. Jednotlivé chatboty Gems si lze přizpůsobit tak, aby fungovali jako odborní poradci v různých oblastech, jako je například programování nebo kreativní psaní.
Uživatelé jednoduše zadají instrukce, dají svému Gemu jméno a pak s ním mohou kdykoli začít chatovat. Gems si dokážou taktéž zapamatovat složitou sadu instrukcí a pomoci tak uživatelům s náročným, opakujícím se úkolem.