Google DeepMind представила Genie 3 , нову систему ШІ, яка перетворює короткий текстовий опис або зображення на інтерактивне 3D чи 2D ігрове середовище з графікою 720p при 24 кадрах на секунду. Користувач може досліджувати згенеровану сцену кілька хвилин поспіль, що суттєво перевищує обмеження попередньої версії Genie 2. Система дозволяє програмувати «події за запитом», завдяки чому можна змінювати погоду або додавати нові об’єкти під час гри без перезапуску середовища.
Використовуючи клавіатуру, користувач керує персонажем у симульованому просторі, а модель підтримує стабільність і деталізацію візуальної пам’яті протягом приблизно хвилини. Genie 3 працює на основі напрацювань попередніх моделей і використовує сучасні методи відеогенерації з сімейства Veo. Платформа вже слугує випробувальним майданчиком для тренування агентів ШІ, які можуть виконувати багатокрокові завдання в складних віртуальних просторах.
Доступ до Genie 3 відкрито у форматі дослідницького попереднього перегляду за запрошеннями. До тестування залучають науковців і цифрових творців, щоб зібрати відгуки й пропозиції щодо безпеки перед ширшим запуском. Перші учасники відзначають значно довший час гри і стабільну геометрію, але звертають увагу на спрощену фізику та обмежене меню дій у порівнянні з класичними ігровими рушіями.
DeepMind позиціонує Genie 3 як частину стратегії «світ як симулятор», що доповнює інші продукти компанії, зокрема AlphaZero і Gemini. За словами розробників, генерація середовищ на вимогу без ручного створення активів може зменшити витрати на дані та обладнання, а також прискорити розвиток загального штучного інтелекту.