Сінгапурська компанія Sapient Intelligence представила нову архітектуру ШІ під назвою Hierarchical Reasoning Model, яка досягає результатів, порівнянних або навіть вищих за великі мовні моделі у складних задачах міркування. Модель HRM використовує підхід, натхненний роботою людського мозку, поєднуючи два рекурентних модулі для повільного планування і швидких обчислень. Така структура дозволяє системі виконувати глибоке багатоступеневе міркування із суттєво меншою кількістю даних і пам’яті, ніж вимагають інші сучасні моделі.
HRM показала високу ефективність на складних завданнях, зокрема на бенчмарках ARC-AGI, екстремальних судоку та задачах з лабіринтами. Наприклад, на тесті «Sudoku-Extreme» і «Maze-Hard» сучасні CoT-моделі не розв’язали жодної задачі, тоді як HRM досягла майже ідеальної точності, навчаючись лише на тисячі прикладів для кожної задачі. На бенчмарку ARC-AGI HRM з 27 мільйонами параметрів набрала 40,3%, що перевищує показники більших моделей, таких як o3-mini-high і Claude 3.7 Sonnet.
За словами засновника компанії Гуань Вана, HRM забезпечує не лише точність, а й значно швидшу обробку завдань. Архітектура дозволяє скоротити затримки під час виконання задач і зменшити витрати, адже для навчання моделі на професійному рівні у судоку достатньо двох годин роботи GPU, а для ARC-AGI — до 200 годин. Це робить модель придатною для використання в умовах обмежених обчислювальних ресурсів і нестачі даних.
HRM рекомендовано застосовувати для складних і детермінованих завдань, де потрібне послідовне прийняття рішень або довгострокове планування, зокрема у робототехніці чи наукових дослідженнях. Модель поступово скорочує кількість необхідних кроків для розв’язання задачі у процесі навчання, що дозволяє досягати експертного рівня.
Компанія Sapient Intelligence вже працює над розвитком HRM у напрямку універсальних модулів міркування, які можуть використовуватись у медицині, кліматичному прогнозуванні та робототехніці. Розробники планують впровадити функції самокорекції, що відрізнятиме ці моделі від сучасних текстових систем.