Google DeepMind представила SIMA 2 — нове покоління універсального ШІ-агента, який об’єднує мовні та логічні можливості моделі Gemini. SIMA 2 навчається не лише виконувати команди, а й розуміти оточення і взаємодіяти з ним у віртуальних світах. На відміну від першої версії, яка могла виконувати прості завдання у відеоіграх, SIMA 2 демонструє вдвічі кращі результати у складних завданнях і самостійно вдосконалює свої навички на основі власного досвіду.
Модель SIMA 2 працює на базі Gemini 2.5 flash-lite і може виконувати завдання у нових ігрових середовищах, навіть якщо раніше з ними не стикалася. Під час демонстрації у грі агент описував навколишній світ, визначав наступні дії і знаходив об’єкти для взаємодії. Крім того, SIMA 2 здатна розуміти абстрактні підказки, наприклад, за допомогою емодзі, і пояснювати свої рішення під час виконання завдань.
Серед нових можливостей — самонавчання без великої кількості людських даних. SIMA 2 отримує початкові знання з ігрових даних, а потім створює для себе нові завдання й оцінює результати за допомогою додаткових моделей Gemini. Це дозволяє агенту вчитися на власних помилках і поступово покращувати поведінку у віртуальних світах.
DeepMind розглядає SIMA 2 як крок до створення універсальних роботів та систем, які зможуть виконувати різноманітні задачі у реальному світі. Хоча компанія поки не назвала терміни впровадження SIMA 2 у фізичну робототехніку, зараз ця модель доступна для дослідників і розробників у форматі обмеженого попереднього перегляду.


