Компанія Alibaba представила технологію Live Avatar для створення інтерактивних аватарів у реальному часі. Вона базується на дифузійній ШІ-моделі з 14 мільярдами параметрів і підтримує потокову генерацію відео з частотою 20 кадрів на секунду. Для роботи Live Avatar потрібно п’ять графічних процесорів H800, які забезпечують чотириступеневу дискретизацію.
Користувачі можуть взаємодіяти з аватарами через мікрофони й камери, спілкуючись у режимі реального часу. Серед можливих сценаріїв використання — прямі онлайн-трансляції, інтерактивні ігри, освітні платформи та створення віртуальних супутників.
Функція стримінгу дозволяє застосовувати Live Avatar для різних видів інтерактивних відео та спілкування. Технологія відкриває нові можливості для створення персоналізованого досвіду у мережі.
Зараз для запуску Live Avatar потрібне потужне обладнання, але Alibaba планує подальшу оптимізацію. Проєкт доступний на GitHub для розробників, які хочуть спробувати нову технологію.

