Hugging Face створює відкритий аналог моделі R1 від DeepSeek

Ініціатива Open-R1 спрямована на створення доступної версії популярної моделі для дослідників і розробників

Опубліковано: 29.01.2025

Логотип Hugging Face (ілюстративне зображення)

На початку тижня DeepSeek випустила нову модель ШІ під назвою R1, яка швидко завоювала популярність. Це не залишило байдужими дослідників з Hugging Face, які вирішили створити відкритий аналог цієї моделі. Проєкт Open-R1 має на меті відтворити R1 з нуля, зробити всі його компоненти та дані загальнодоступними.

Ініціатива виникла через непрозорість DeepSeek щодо деталей створення R1. Хоча модель має дозвільну ліцензію, вона не є повністю відкритою. Відсутність доступу до даних і експериментальних деталей ускладнює її вивчення. Команда Hugging Face наголошує на важливості відкритості для розкриття потенціалу моделі.

R1 відзначилася своєю здатністю перевіряти власні факти, що робить її більш надійною в таких сферах, як фізика, наука та математика. Популярність моделі зросла після успіху чат-бота від DeepSeek, який швидко підкорив вершини Apple App Store. Такі досягнення викликали питання серед аналітиків щодо конкурентоспроможності США в сфері ШІ.

Open-R1 прагне розкрити «чорний ящик» навчання моделі. Використовуючи обчислювальні ресурси Hugging Face, команда залучає спільноту для створення тренувальних наборів даних, схожих на ті, що використовувала DeepSeek. Проєкт швидко набирає популярність на GitHub, що свідчить про великий інтерес до відкритих розробок у сфері ШІ.

Якщо Open-R1 досягне успіху, це стане основою для нових відкритих моделей, які зможуть використовувати інші дослідники. Відкритий підхід у розвитку ШІ може принести користь усім, хто працює над інноваціями, і змінити уявлення про те, хто здатен робити прогрес у цій галузі.