Компанія NVIDIA представила нову ШІ-модель Fugatto, яка перетворює текстові запити для створення звуків, музики та навіть голосів. Ця модель є універсальним інструментом для роботи зі звуком, здатним створювати або трансформувати будь-який аудіоконтент, від музичних уривків до унікальних звукових ефектів.
За словами розробників, Fugatto підтримує широкий спектр завдань — від додавання інструментів у вже існуючу композицію до зміни акценту чи емоцій у голосі. «Цей інструмент дозволяє створювати абсолютно нові звуки буквально на льоту», — зазначив Ідо Змішлані, продюсер та один із партнерів проєкту.
Fugatto працює на основі генеративного трансформера з 2,5 мільярдами параметрів. Його тренування проходило на суперкомп’ютерах NVIDIA із використанням новітніх GPU. Завдяки цьому модель може не тільки виконувати завдання, на яких її навчали, а й генерувати нові, небачені раніше звукові ландшафти, наприклад, поступовий перехід від грози до співу птахів на світанку.
Ця технологія відкриває безліч можливостей для музикантів, рекламних агентств, розробників ігор та освітніх платформ. Вона дозволяє створювати звук у режимі реального часу, змінювати емоційний контекст голосів і створювати унікальні звукові ефекти, зокрема такі, що раніше не існували.