Китайська DeepSeek випустила нову «думаючу» ШІ-модель

DeepSeek-R1 доступна на платформі Hugging Face, має 671 мільярд параметрів і конкурує з OpenAI o1 на тестах

Опубліковано: 21.01.2025

Ілюстративне зображення

Китайська лабораторія DeepSeek представила нову відкриту версію своєї моделі DeepSeek-R1, яка, за їхніми словами, може конкурувати з OpenAI o1 на певних тестах ШІ. Модель R1 доступна на платформі Hugging Face під ліцензією MIT, що дозволяє її комерційне використання без обмежень. DeepSeek заявляє, що R1 перевершує o1 на тестах AIME, MATH-500 та SWE-bench Verified. Модель R1 ефективно перевіряє свої результати, що допомагає уникати помилок, які часто виникають у інших моделей.

🚀 DeepSeek-R1 is here!

⚡ Performance on par with OpenAI-o1
📖 Fully open-source model & technical report
🏆 MIT licensed: Distill & commercialize freely!

🌐 Website & API are live now! Try DeepThink at https://t.co/v1TFy7LHNy today!

🐋 1/n pic.twitter.com/7BlpWAPu6y
— DeepSeek (@deepseek_ai) January 20, 2025

DeepSeek-R1 містить 671 мільярд параметрів, що робить її однією з найбільших моделей у світі. Водночас DeepSeek випустила «дистильовані» версії R1, які варіюються від 1,5 мільярда до 70 мільярдів параметрів, що дозволяє запускати найменші з них на звичайних ноутбуках. Повна версія R1 вимагає потужнішого обладнання, однак доступна через API DeepSeek за цінами на 90-95% нижчими, ніж у OpenAI o1.

Модель R1 підлягає регулюванню з боку китайських інтернет-органів, що означає, що вона не відповідатиме на запити, які можуть викликати незадоволення регуляторів, такі як питання про події на площі Тяньаньмень або автономію Тайваню. Це обмеження поширене серед багатьох китайських моделей ШІ, які уникають відповідей на чутливі теми.

Позначки:DeepSeek Hugging Face

Коментарів немає

Китайська DeepSeek випустила нову «думаючу» ШІ-модель

Залишити відповідь Скасувати коментар

Слідкуй за нами

Популярні новини

Навігація

Корисне

Читайте також

Залишити відповідь Скасувати коментар

Слідкуй за нами

Популярні новини

Читайте також

Берлін закликає Apple і Google видалити DeepSeek з магазинів застосунків

Масив фанфіків використали для навчання ШІ без згоди їх авторів

Новий спосіб створювати таблиці за допомогою ШІ від Hugging Face

Прокачайся з AI!