Стартап Odyssey, підтриманий співзасновником Pixar Едом Кетмуллом, відкрив для користувачів демо-версію нової генеративної моделі ШІ, яка створює інтерактивне відео у реальному часі. Користувачі можуть пересуватися віртуальними світами за допомогою стандартних ігрових клавіш, досліджуючи різні оточення — від лісової місцевості з будиночком до торгового центру чи паркінгу. Модель стрімить згенеровані відеокадри кожні сорок мілісекунд, забезпечуючи майже миттєву реакцію на дії глядача.
Introducing AI video you can watch and interact with, in real-time!
— Odyssey (@odysseyml) May 28, 2025
Powering this is a new world model that imagines and streams video frames every 40ms(!). No game engine in sight.
We call it interactive video, and it's free for anyone to try right now (GPUs permitting)! pic.twitter.com/QtADRXCQ8z
Демо Odyssey доступне у браузері й дозволяє взаємодіяти зі світом протягом двох з половиною хвилин за одну сесію, після чого її можна перезапустити. Зображення наразі залишається розмитим, а оточення іноді змінюється під час руху, що робить досвід схожим на прогулянку у нестабільному сні. Деякі об’єкти мають колізії, але часто користувач може пройти крізь стіни чи інші перешкоди.
Odyssey використовує кластери графічних процесорів Nvidia H100 для генерації та трансляції відео з частотою до тридцяти кадрів на секунду. Для побудови моделей команда розробила спеціальну камеру з оглядом триста шістдесят градусів, що дозволяє захоплювати реальні ландшафти й створювати більш реалістичні простори у порівнянні з підходами, заснованими лише на відкритих даних.
Компанія підкреслює, що метою є не заміна творчих професіоналів, а співпраця з ними. Вже зараз Odyssey працює над можливістю експорту сцен, згенерованих моделлю, у популярні інструменти для відеомонтажу, такі як Unreal Engine, Blender та Adobe After Effects, де їх можна доробляти вручну. Розробники планують поступово розширювати функціонал, додаючи більше можливостей для взаємодії та підвищуючи стабільність створених світів.