Google представила нову модель ШІ для редагування зображень «Gemini 2.5 Flash Image», яка вже доступна користувачам у додатку Gemini, а також розробникам через Gemini API, Google AI Studio і Vertex AI. Ця модель дозволяє набагато точніше змінювати фото за текстовими запитами, зберігаючи при цьому впізнаваність людей, тварин і деталей, що часто викликає труднощі у конкурентів. Наприклад, користувачі можуть змінювати кольори одягу чи поєднувати кілька об’єктів на фото, і результат виглядає природньо — без спотворених облич або фону.
Унікальною особливістю «Gemini 2.5 Flash Image» стала стабільність персонажів: модель здатна тримати однаковий вигляд людини чи предмета у різних сценах, незалежно від зміни поз, освітлення або оточення. Це відкриває можливості для створення серій зображень чи каталогів товарів, де важлива послідовність і впізнаваність.
Google наголошує, що модель працює з «багатотуровими» діалогами, дозволяючи користувачам поетапно вносити зміни і уточнювати запити до ШІ. Серед інших функцій — поєднання кількох фото, перенесення стилю чи фактури з одного об’єкта на інший, а також створення складних композицій на основі текстових підказок.
Для безпеки Google додала до кожного згенерованого зображення як видимий водяний знак, так і цифровий маркер SynthID у метаданих, щоб ускладнити поширення фейкових фото. У компанії підкреслюють, що моделі обмежують створення заборонених зображень, і користувачі отримують більше контролю над творчим процесом, але не можуть порушувати правила платформи.