Як ми вже повідомляли, здається, OpenAI готує до випуску нові моделі генерації зображень.
Чесно кажучи, попри те що поточна модель, яка використовується в ChatGPT з’явилася зовсім недавно і швидко стала популярною, сьогодні вона вже виглядає трохи застарілою. Конкуренти не сплять і ледве не щотижня випускають щось новеньке — з новими фічами, покращеною передачею кольорів і загальною якістю візуалу.
Тому потенційна поява наступного покоління моделей — безумовно гарна новина. Якщо, звичайно, інформація підтвердиться. Зараз немає точних даних, чи є ці невідомі моделі саме Image-2 та Image-2-mini, але все вказує саме на це.
Поки що протестувати їх можна тільки на онлайн-аренах. І це не надто зручно — доводиться запускати порівняння з іншими моделями знову і знову, сподіваючись, що серед кандидатів випадуть саме нові. Проте я спробував.
І ось що вийшло:






Перші враження такі:
Візуал став помітно різноманітнішим. Поточна модель часто додає всім відомий жовтуватий «старий» відтінок і впізнаваний стиль. Натомість нові результати виглядають набагато різнішими — ніби модель відмовилась від шаблонності і дозволяє більше варіативності.
Також змінилася деталізація. Буквально все потопає в дрібних елементах, текстурах і нюансах — інколи навіть перебір, але це краще, ніж зворотне.
Часто трапляється розмитий фон або легке змазування об’єкта в русі. Можливо, таким чином модель намагається додати реалістичності та «камерності» кадру.
Ще одна цікава деталь — деякі зображення нагадують доопрацьований DALL-E з більш зрілим рендерингом і чистішою структурою.
Звичайно, до офіційного релізу багато що може змінитися, тож будемо стежити, як розвиватиметься ситуація. Але вже зараз видно, що це потенційно великий крок уперед. І, можливо, саме той апгрейд, який OpenAI давно був винен своїй екосистемі.


