Раніше ця модель була доступна лише для користувачів з підпискою Gemini Advanced або Gemini for Workspace.
Imagen 3 забезпечує високий рівень фотореалізму, точніше розуміє текстові запити та генерує зображення з меншою кількістю візуальних артефактів, ніж попередні версії. Модель вміє розпізнавати деталі у складних запитах і створює зображення з роздільною здатністю 2048×2048 пікселів. Також завдяки інтеграції новітніх методів безпеки, модель уникає створення контенту, який може бути шкідливим або неприйнятним, зокрема фотографій конкретних осіб.
Google особливо звертає увагу на етичність та відповідальності в роботі своєї моделі. Інструмент пройшов ретельне фільтрування даних, що знижує ймовірність створення неприйнятного контенту.
Imagen 3 — це наша найякісніша модель зображення, яка забезпечує ще більший ступінь фотореалізму, краще виконання інструкцій і менше відволікаючих артефактів, ніж будь-коли раніше.
Проте у Imagen 3 є певні обмеження у порівнянні з конкурентами, такими як Midjourney та DALL-E 3. Модель не дозволяє змінювати співвідношення сторін та роздільну здатність зображень, що звичайно є важливим для професіоналів, які потребують більшої гнучкості у роботі з зображеннями.


Спробувати можливості Imagen 3 можна через чат-бот Gemini. Просто увійдіть в чат за допомогою свого облікового запису Google та напишіть там яке зображення ви хочете отримати. Але зважайте на те, що у безкоштовній версії генерація людей все ще не підтримується.