Лабораторія Tongyi від Alibaba представила Z-Image-Turbo — нову відкриту модель генерації зображень, яка працює без обмежень і створює реалістичні картинки вже на відеокартах із 6 ГБ пам’яті. Користувачі можуть запускати її локально навіть на ноутбуках із RTX 2060 та отримувати зображення за пів хвилини. Модель не має цензури, тож здатна генерувати будь-який контент, включно з портретами відомих людей та вигаданих персонажів.

Z-Image-Turbo має 6 мільярдів параметрів і використовує архітектуру S3-DiT, що дозволяє об’єднувати текстові та візуальні дані для максимальної ефективності. Вона точно відтворює складні сцени, деталізує шкіру, волосся та пропорції тіл, а також демонструє високий рівень розуміння стилю та просторових відносин. Модель виконує інструкції користувачів і майже не допускає помилок у складних композиціях.
Окремою перевагою є якість генерації тексту на зображеннях англійською та китайською мовами. Z-Image-Turbo впевнено працює з написами, що раніше було проблемою для інших відкритих моделей. Користувачі відзначають, що підказки китайською мовою дають ще кращі результати, а функція «prompt enhancer» допомагає отримати бажане зображення.
Модель швидко набрала популярності серед спільноти: на платформі Civitai вже доступно понад 200 додаткових ресурсів і тисячі позитивних відгуків. Розробники також анонсували дві нові версії — Z-Image-Base для доопрацювання та Z-Image-Edit для редагування зображень за текстовими інструкціями, які з’являться найближчим часом.
Z-Image-Turbo вже доступна для завантаження та використання , і багато ентузіастів ШІ відзначають її як найкраще рішення для генерації реалістичних зображень на звичайних домашніх комп’ютерах.


