Google представила нову текстово-графічну модель Imagen 4, яка вже доступна для попереднього ознайомлення в Gemini API. З 24 червня користувачі можуть безкоштовно тестувати її у Google AI Studio. Модель дозволяє створювати до чотирьох зображень розміром 1024 на 1024 пікселі за один запит і приймає підказки до 480 токенів.
Вартість одного зображення складає близько 0,04 долара, а версія з підвищеною якістю Imagen 4 Ultra коштує приблизно 0,06 долара за зображення. Обидві версії використовують водяні знаки SynthID та забезпечують майже миттєве створення зображень. Imagen 4 Ultra забезпечує точніше виконання підказок і дозволяє експортувати зображення у форматі 2K через Vertex AI.
Розробники можуть використовувати той самий ендпоінт «/generate», що й для моделей Gemini, і можуть подавати запити на підвищення лімітів під час тестового періоду. Стандартний ліміт складає 20 запитів на хвилину для одного проєкту.
Перші користувачі вже діляться результатами у соцмережі X, відзначаючи чіткіші написи та менше артефактів у порівнянні з Imagen 3. Запуск Imagen 4 розширює набір інструментів Google DeepMind, до якого вже входять Imagen, Veo і сімейство моделей Gemini.