Tencent представила спрощену версію своєї генеративної ШІ Hunyuan World Model 1.0 під назвою «1.0-Lite». Нова модель працює швидше і споживає приблизно на 35 відсотків менше відеопам’яті, ніж оригінальна версія. Для запуску «1.0-Lite» потрібно менше 17 гігабайт графічної пам’яті, що дозволяє використовувати її на звичайних споживчих відеокартах.
Як і основна версія, «1.0-Lite» доступна з відкритим кодом і розповсюджується через GitHub, Hugging Face та інтерактивну демоверсію sceneTo3D. Користувачі можуть ознайомитися з технічним описом моделі на arxiv.org. Модель призначена для створення 3D-сцен з текстових або візуальних підказок, підтримує панорамне зображення та ієрархічну 3D-реконструкцію.
Hunyuan World Model 1.0 дозволяє окремо редагувати об’єкти в сцені, наприклад, пересувати транспорт, дерева чи меблі. Окремо виділена «небесна сфера», яку можна використовувати як джерело динамічного освітлення для реалістичного рендерингу. Модель підтримує два основних типи введення — «text-to-world» та «image-to-world», а створені сцени можна експортувати у форматі mesh для подальшої роботи у стандартних 3D-середовищах.
Готові сцени — це інтерактивні 360-градусні панорами, у яких можна оглядатися і переміщуватися в певних межах. Для ширших можливостей камерного руху чи триваліших 3D-відео потрібен додатковий модуль Voyager. Розробники зазначають, що модель підходить для роботи з ігровими рушіями, VR-платформами та іншими інструментами створення віртуального контенту.
Окрім Hunyuan World Model 1.0, Tencent відкрила доступ до Hunyuan3D 2.0 для генерації текстурованих 3D-моделей, HunyuanVideo для створення відео за допомогою ШІ, а також мовної моделі Hunyuan-A13B з динамічним міркуванням.