Китайська лабораторія DeepSeek представила нову відкриту версію своєї моделі DeepSeek-R1, яка, за їхніми словами, може конкурувати з OpenAI o1 на певних тестах ШІ. Модель R1 доступна на платформі Hugging Face під ліцензією MIT, що дозволяє її комерційне використання без обмежень. DeepSeek заявляє, що R1 перевершує o1 на тестах AIME, MATH-500 та SWE-bench Verified. Модель R1 ефективно перевіряє свої результати, що допомагає уникати помилок, які часто виникають у інших моделей.
🚀 DeepSeek-R1 is here!
— DeepSeek (@deepseek_ai) January 20, 2025
⚡ Performance on par with OpenAI-o1
📖 Fully open-source model & technical report
🏆 MIT licensed: Distill & commercialize freely!
🌐 Website & API are live now! Try DeepThink at https://t.co/v1TFy7LHNy today!
🐋 1/n pic.twitter.com/7BlpWAPu6y
DeepSeek-R1 містить 671 мільярд параметрів, що робить її однією з найбільших моделей у світі. Водночас DeepSeek випустила «дистильовані» версії R1, які варіюються від 1,5 мільярда до 70 мільярдів параметрів, що дозволяє запускати найменші з них на звичайних ноутбуках. Повна версія R1 вимагає потужнішого обладнання, однак доступна через API DeepSeek за цінами на 90-95% нижчими, ніж у OpenAI o1.
Модель R1 підлягає регулюванню з боку китайських інтернет-органів, що означає, що вона не відповідатиме на запити, які можуть викликати незадоволення регуляторів, такі як питання про події на площі Тяньаньмень або автономію Тайваню. Це обмеження поширене серед багатьох китайських моделей ШІ, які уникають відповідей на чутливі теми.