Alibaba представила нову ШІ-модель для роботи з зображеннями під назвою Z-Image. Вона має розмір шість мільярдів параметрів і підходить для запуску на локальних пристроях. Модель підтримує створення зображень із роздільною здатністю до 2K, а також дозволяє виконувати складне редагування за допомогою текстових команд. Протестувати нову модель можна тут .

Однією з ключових можливостей Z-Image є функція «Prompt Enhancer», яка допомагає моделі краще розуміти складні або нечіткі інструкції користувача. Модель демонструє фотореалізм, добре передає природне освітлення, текстуру шкіри, глибину різкості та баланс кольорів. Вона може одночасно змінювати вираз обличчя, навколишнє середовище й освітлення, зберігаючи цілісність зображення.
Z-Image має глибоке семантичне та культурне розуміння. Модель знає про пам’ятки, людей, свята, поезію та інші поняття, що дозволяє їй створювати зображення з урахуванням культурного контексту. Для редагування зображень доступна функція «Z-Image-Edit», яка підтримує складні текстові команди.
За результатами оцінювання Elo Human Preference Assessment на платформі AI Arena, Z-Image показує високу конкурентоспроможність серед відкритих моделей зображень.


