OpenAI оголосила про запуск можливості генерації зображень на базі моделі «gpt-image-1» через API, що дозволяє розробникам інтегрувати функцію у власні додатки та сервіси. Ця ж модель вже доступна у ChatGPT та отримала популярність завдяки створенню зображень у стилі Studio Ghibli й різноманітних «AI action figures». За даними компанії, понад сто тридцять мільйонів користувачів ChatGPT створили більш як сімсот мільйонів зображень лише за перший тиждень роботи цієї функції.
Модель «gpt-image-1» дозволяє створювати зображення у різних стилях, дотримуватись заданих інструкцій, використовувати знання про світ та точно відтворювати текст. Розробники можуть генерувати одразу декілька зображень, обирати якість, а відповідно — і швидкість отримання результату. Модель використовує ті ж самі засоби безпеки, що й у ChatGPT, включаючи захист від створення небажаного контенту. Можна налаштувати чутливість модерації — стандартний фільтр або менш суворий режим для обмеженого кола категорій контенту.
Усі зображення, створені за допомогою цієї моделі, містять водяні знаки у вигляді C2PA-метаданих, що дозволяє платформам і додаткам визначати, що зображення згенероване ШІ. Вартість використання моделі складає п’ять доларів за мільйон вхідних токенів для тексту, десять доларів — для зображень, та сорок доларів за мільйон вихідних токенів для зображень. За підрахунками OpenAI, це приблизно дві, сім та дев’ятнадцять центів за одне зображення низької, середньої та високої якості відповідно.
Вже зараз такі компанії, як Adobe, Figma, Canva, Wix, Instacart та GoDaddy, використовують або тестують інтеграцію «gpt-image-1» у своїх продуктах. Наприклад, у Figma Design користувачі можуть генерувати та редагувати зображення за допомогою простих підказок, змінювати стилі, додавати чи видаляти об’єкти, розширювати фони тощо. Adobe надає доступ до цієї функції у своїх додатках Firefly та Express, що дозволяє користувачам експериментувати з різними стилями для створення креативних ідей.