Нова технологія ШІ забезпечує в 100 раз швидше міркування

Сінгапурська компанія Sapient Intelligence представила нову архітектуру ШІ під назвою Hierarchical Reasoning Model, яка досягає результатів, порівнянних або навіть вищих за великі мовні моделі у складних задачах міркування. Модель HRM використовує підхід, натхненний роботою людського мозку, поєднуючи два рекурентних модулі для повільного планування і швидких обчислень. Така структура дозволяє системі виконувати глибоке багатоступеневе міркування із суттєво меншою кількістю даних і пам’яті, ніж вимагають інші сучасні моделі.

HRM показала високу ефективність на складних завданнях, зокрема на бенчмарках ARC-AGI, екстремальних судоку та задачах з лабіринтами. Наприклад, на тесті «Sudoku-Extreme» і «Maze-Hard» сучасні CoT-моделі не розв’язали жодної задачі, тоді як HRM досягла майже ідеальної точності, навчаючись лише на тисячі прикладів для кожної задачі. На бенчмарку ARC-AGI HRM з 27 мільйонами параметрів набрала 40,3%, що перевищує показники більших моделей, таких як o3-mini-high і Claude 3.7 Sonnet.

За словами засновника компанії Гуань Вана, HRM забезпечує не лише точність, а й значно швидшу обробку завдань. Архітектура дозволяє скоротити затримки під час виконання задач і зменшити витрати, адже для навчання моделі на професійному рівні у судоку достатньо двох годин роботи GPU, а для ARC-AGI — до 200 годин. Це робить модель придатною для використання в умовах обмежених обчислювальних ресурсів і нестачі даних.

HRM рекомендовано застосовувати для складних і детермінованих завдань, де потрібне послідовне прийняття рішень або довгострокове планування, зокрема у робототехніці чи наукових дослідженнях. Модель поступово скорочує кількість необхідних кроків для розв’язання задачі у процесі навчання, що дозволяє досягати експертного рівня.

Компанія Sapient Intelligence вже працює над розвитком HRM у напрямку універсальних модулів міркування, які можуть використовуватись у медицині, кліматичному прогнозуванні та робототехніці. Розробники планують впровадити функції самокорекції, що відрізнятиме ці моделі від сучасних текстових систем.

Нова технологія ШІ забезпечує в 100 раз швидше міркування

Залишити відповідь Скасувати коментар

Слідкуй за нами

Популярні новини

Навігація

Корисне

Читайте також

Залишити відповідь Скасувати коментар

Слідкуй за нами

Популярні новини

Читайте також

Google запускає режим Deep Think для користувачів Gemini Ultra

Mistral AI представила нову серію моделей Mistral 3 для бізнесу

Популярність чат-ботів швидко зростає серед різних поколінь

Прокачайся з AI!