Google представила оновлення для своєї ШІ-моделі Veo 3, яке дозволяє створювати відео тривалістю до восьми секунд із одного статичного зображення. Тепер користувачі можуть генерувати відеокліпи з додаванням ШІ-згенерованого аудіо, включаючи фонові звуки та навіть фрази, які вимовляє персонаж у відео. Функція вже доступна в режимі «preview offering» через Google Cloud і працює для всіх клієнтів та партнерів у Vertex AI Media Studio у 159 країнах.
Нову можливість можна використовувати для створення коротких відеороликів із зображень людей або продуктів, зокрема для соцмереж чи реклами. Наприклад, інфлюенсер може завантажити власне фото і отримати кліп, де її ШІ-копія крокує подіумом у брендовому одязі. Бренди можуть відправити зображення товару й отримати ролик, який демонструє продукт з різних ракурсів та з супроводжуючим аудіо.
Veo 3 презентували у травні на конференції Google I/O. Модель одразу привернула увагу завдяки поєднанню відео та аудіо, а також здатності відтворювати реалістичну фізику руху. Google продовжує активно розвивати цей напрямок, і нещодавно Деміс Хассабіс із Google DeepMind натякнув, що Veo 3 можуть використовувати для створення віртуальних світів у відеоіграх.
Разом із новими можливостями Veo 3 з’явилися питання щодо джерел навчальних даних моделі, оскільки Хассабіс заявив, що для цього могли використовуватися відео з YouTube. Деякі представники індустрії стурбовані ризиком поширення дезінформації та порушенням авторських прав.