Компанія ByteDance, відома як власник TikTok, представила нову систему генеративного ШІ під назвою OmniHuman-1, яка здатна створювати неймовірно реалістичні відео-дипфейки. На відміну від багатьох інших систем, які часто залишають очевидні сліди втручання ШІ, OmniHuman-1 вражає своєю здатністю уникати моторошної долини. У демонстраційних відео, оприлюднених командою ByteDance, можна побачити вигадані виступи відомих особистостей, таких як Тейлор Свіфт або Альберт Ейнштейн.
OmniHuman-1 потребує лише одного зображення та аудіо, щоб створити відео будь-якої тривалості. Можна налаштувати співвідношення сторін відео, а також пропорції тіла суб’єкта. Модель була навчена на 19 тисячах годин відеоконтенту з невідомих джерел. Вона може навіть редагувати існуючі відео, змінюючи рухи кінцівок людей. Це вражаючий крок вперед у світі дипфейків.
Втім, система не позбавлена недоліків. ByteDance зазначає, що «низькоякісні» зображення не дають найкращих результатів, а деякі пози можуть бути проблематичними для моделі.
Швидкий розвиток дипфейків викликає занепокоєння. Минулого року політичні дипфейки поширювалися по всьому світу, включаючи випадки в Тайвані, Молдові та Південній Африці. Дипфейки також використовуються для фінансових злочинів, обманюючи споживачів та компанії. За даними Deloitte, у 2023 році ШІ згенерував понад 12 мільярдів доларів втрат через шахрайство, і ця сума може зрости до 40 мільярдів доларів у США до 2027 року.
Зростання кількості дипфейків ускладнює їх виявлення, і більшість людей стурбовані можливістю бути обманутими. Хоча деякі соціальні мережі та пошукові системи намагаються обмежити їх поширення, обсяг контенту, створеного ШІ, продовжує зростати.