Amazon представила нову генеративну модель ШІ під назвою Nova Sonic , яка здатна обробляти голос і генерувати природне звучання мовлення. За твердженням компанії, продуктивність Nova Sonic може конкурувати з провідними голосовими моделями від OpenAI та Google за такими показниками, як швидкість, розпізнавання мовлення та якість діалогу. Ця модель є відповіддю Amazon на нові голосові моделі ШІ, які забезпечують більш природну взаємодію в порівнянні зі старими моделями, такими як Alexa.
Nova Sonic доступна через платформу Bedrock, яка призначена для розробки корпоративних застосунків ШІ. Amazon називає Nova Sonic «найбільш економічно вигідною» моделлю на ринку, яка на вісімдесят відсотків дешевша за GPT-4o від OpenAI. Компоненти Nova Sonic вже використовуються в оновленому голосовому асистенті Alexa+.
Nova Sonic відрізняється високою точністю розпізнавання мовлення, навіть у шумних умовах або при нечіткій вимові, досягнувши рівня помилок у словах лише 4,2 відсотка на багатомовному тесті. Модель також демонструє швидкість у відповідях з середньою затримкою 1,09 секунди, що швидше за модель GPT-4o від OpenAI.
Ця технологія може бути використана для створення ботів обслуговування клієнтів або агентів ШІ для різних галузей, таких як подорожі, освіта та охорона здоров’я. Nova Sonic вже активно інтегрується в новий асистент Alexa Plus, що свідчить про зростаючу роль відділу AGI Amazon у стратегії компанії.