ByteDance презентувала систему OmniHuman-1 для реалістичних дипфейків

Нова технологія здатна створювати відео з одного зображення та аудіо, але має певні обмеження

Опубліковано: 05.02.2025

Кадр із дипфейкового відео

Компанія ByteDance, відома як власник TikTok, представила нову систему генеративного ШІ під назвою OmniHuman-1, яка здатна створювати неймовірно реалістичні відео-дипфейки. На відміну від багатьох інших систем, які часто залишають очевидні сліди втручання ШІ, OmniHuman-1 вражає своєю здатністю уникати моторошної долини . У демонстраційних відео, оприлюднених командою ByteDance, можна побачити вигадані виступи відомих особистостей, таких як Тейлор Свіфт або Альберт Ейнштейн.

https://www.youtube.com/watch?v=n6HKcS2pj0Q

OmniHuman-1 потребує лише одного зображення та аудіо, щоб створити відео будь-якої тривалості. Можна налаштувати співвідношення сторін відео, а також пропорції тіла суб’єкта. Модель була навчена на 19 тисячах годин відеоконтенту з невідомих джерел. Вона може навіть редагувати існуючі відео, змінюючи рухи кінцівок людей. Це вражаючий крок вперед у світі дипфейків.

Втім, система не позбавлена недоліків. ByteDance зазначає, що «низькоякісні» зображення не дають найкращих результатів, а деякі пози можуть бути проблематичними для моделі.

Швидкий розвиток дипфейків викликає занепокоєння. Минулого року політичні дипфейки поширювалися по всьому світу, включаючи випадки в Тайвані, Молдові та Південній Африці. Дипфейки також використовуються для фінансових злочинів, обманюючи споживачів та компанії. За даними Deloitte, у 2023 році ШІ згенерував понад 12 мільярдів доларів втрат через шахрайство, і ця сума може зрости до 40 мільярдів доларів у США до 2027 року.

Зростання кількості дипфейків ускладнює їх виявлення, і більшість людей стурбовані можливістю бути обманутими. Хоча деякі соціальні мережі та пошукові системи намагаються обмежити їх поширення, обсяг контенту, створеного ШІ, продовжує зростати.