Google DeepMind представила нову версію генеративного ШІ для створення відео — Veo 2. Ця версія є наступником Veo і може створювати відеоролики тривалістю понад дві хвилини у роздільній здатності до 4k. Це в чотири рази більше роздільна здатність і в шість разів довша тривалість, ніж у Sora від OpenAI. Однак у експериментальному інструменті VideoFX, де Veo 2 наразі доступний, відео обмежені 720p і вісьма секундами.
За словами віцепрезидента з продуктів DeepMind Елі Коллінза, компанія планує поступово розширювати доступ до VideoFX та інтегрувати Veo 2 у платформу розробників Vertex AI. «Протягом найближчих місяців ми продовжимо вдосконалювати модель на основі відгуків користувачів», — зазначив Коллінз.
Veo 2 може створювати відео на основі текстових підказок або комбінації тексту та зображень. У новій версії покращено розуміння фізики та керування камерою, а також підвищено чіткість зображень. Veo 2 здатний реалістично моделювати рух, динаміку рідин і властивості світла. Проте, модель все ще має проблеми з узгодженістю персонажів і деталями.
DeepMind продовжує співпрацювати з художниками і продюсерами, зокрема Дональдом Гловером та The Weeknd, для вдосконалення моделей генерації відео. «Ми з нетерпінням чекаємо на роботу з перевіреними тестувальниками та творцями, щоб отримати зворотний зв’язок», — заявив Коллінз.
Для підвищення безпеки DeepMind використовує технологію водяних знаків SynthID, щоб вбудовувати невидимі маркери у кадри, згенеровані Veo 2. Водночас Google оголосила про оновлення моделі генерації зображень Imagen 3, яка тепер може створювати більш яскраві та деталізовані зображення у різних стилях.