У вебінтерфейсі ChatGPT з’явилася нова опція — «GPT‑4o Image Generation» для створення зображень у конструкторі користувацьких GPT. Це свідчить про підготовку OpenAI до запуску можливості для створених користувачами ботів генерувати зображення за допомогою тієї ж мультимодальної моделі, яка вже використовується у власному інструменті ChatGPT для роботи з картинками. Нова функція замінює попередню підтримку DALL‑E 3, що може забезпечити однакові можливості для всіх користувачів після початку розгортання.
Завдяки цій зміні користувацькі GPT зможуть перетворювати текстові запити безпосередньо на фотореалістичні або стилізовані візуальні зображення, не використовуючи сторонні сервіси. Це дозволить різноманітним спеціалізованим асистентам — наприклад, стилістам чи викладачам біології — створювати, редагувати та уточнювати картинки у межах однієї розмови, що робить взаємодію з ботами більш динамічною та зручною для користувачів.
Модель GPT‑4o для роботи з зображеннями, представлена у ChatGPT наприкінці березня, демонструє покращене відображення тексту, точніше передає ознаки об’єктів і забезпечує послідовність зображення персонажів. Зображення створюються поетапно, що підвищує точність, хоча й займає трохи більше часу порівняно з попередніми підходами.
Нову можливість вже можна випробувати на прикладі GPT «Cyberpunk Artist», у якому активовано генерацію зображень через GPT‑4o. Поки що ця функція перебуває на експериментальному етапі, і результати можуть бути непослідовними, однак розширення таких можливостей для користувацьких GPT відкриває додаткові переваги для розробників і бізнесу.
OpenAI поки не оголосила конкретних термінів запуску, проте поява відповідного перемикача зазвичай передує поступовому впровадженню для користувачів рівнів Plus, Pro та Team. Після початку розгортання автори ботів зможуть швидко підключати GPT‑4o image generation, підвищуючи залученість користувачів і розширюючи функціонал своїх асистентів.