Стартап Nous Research представив нову лінійку мовних моделей Hermes 4, які орієнтовані на максимально відкриту взаємодію з користувачем та мінімальні обмеження вмісту. Hermes 4 підтримує функцію «hybrid reasoning», що дозволяє перемикатися між швидкими відповідями та детальним покроковим міркуванням. Коли активовано цей режим, модель показує свій хід думок у спеціальних тегах перед фінальною відповіддю, забезпечуючи прозорість процесу.
В тестах найбільша модель Hermes 4 на 405 мільярдів параметрів набрала 96,3% у математичному бенчмарку MATH-500 та 81,9% у конкурсі AIME’24, досягаючи рівня закритих систем. На новому тесті RefusalBench, який оцінює, як часто ШІ відмовляється відповідати на запити, Hermes 4 показала результат 57,1% у reasoning-режимі, значно випередивши GPT-4o і Claude Sonnet 4.
Модель навчали за допомогою двох власних систем: DataForge, що генерує складні навчальні приклади, і Atropos — відкритої платформи для підкріплювального навчання з тисячами спеціалізованих середовищ. Для тренування найбільшої версії Hermes 4 використали 192 графічні процесори Nvidia B200 і понад 70 тисяч годин обчислень.
Hermes 4 доступна для завантаження на Hugging Face, а також через API і новий інтерфейс Nous Chat із підтримкою паралельних діалогів та системою пам’яті. Користувачі можуть застосовувати модель для задач, де потрібна гнучкість, відсутність жорстких обмежень та робота з чутливим контентом.
Nous Research підкреслює максимальний контроль користувача та прозорість, надаючи докладний технічний звіт із результатами тестів і прикладами відповідей. Такий підхід робить Hermes 4 популярною серед розробників і дослідників, які цінують відкритість та можливість самостійного налаштування ШІ під власні потреби.