Компанія Anthropic протестувала свою нову модель генеративного штучного інтелекту Claude 3.7 Sonnet за допомогою класичної гри Game Boy — Pokémon Red. У своєму блозі Anthropic повідомила, що модель була оснащена базовою пам’яттю, могла отримувати вхідні дані з пікселів екрану та виконувати функціональні виклики для натискання кнопок і навігації по екрану, що дозволило їй безперервно грати в Pokémon.
Однією з унікальних особливостей Claude 3.7 Sonnet є здатність до «розширеного мислення». Це дозволяє моделі вирішувати складні завдання, застосовуючи більше обчислювальних ресурсів та витрачаючи більше часу. Порівняно з попередньою версією, Claude 3.0 Sonnet, яка не змогла покинути будинок у місті Паллета, Claude 3.7 Sonnet успішно перемогла трьох лідерів тренажерних залів у грі та здобула їхні значки.
Хоча поки що невідомо, скільки обчислювальних ресурсів знадобилося для досягнення цих результатів, компанія зазначила, що модель виконала 35 тисяч дій, щоб дійти до останнього лідера тренажерного залу на ім’я Surge.