Китайська лабораторія DeepSeek представила новий «модуль мислення» ШІ, який може конкурувати з OpenAI o1. DeepSeek-R1, як стверджують розробники, здатний ефективно перевіряти себе, витрачаючи більше часу на обдумування запитів. Це допомагає уникати типових помилок, які трапляються у моделях.
🚀 DeepSeek-R1-Lite-Preview is now live: unleashing supercharged reasoning power!
— DeepSeek (@deepseek_ai) November 20, 2024
🔍 o1-preview-level performance on AIME & MATH benchmarks.
💡 Transparent thought process in real-time.
🛠️ Open-source models & API coming soon!
🌐 Try it now at https://t.co/v1TFy7LHNy#DeepSeek pic.twitter.com/saslkq4a1s
Подібно до o1, DeepSeek-R1 виконує завдання шляхом планування та виконання дій, що допомагають дійти до відповіді. Залежно від складності запитання, DeepSeek-R1 може «думати» протягом кількох десятків секунд. DeepSeek стверджує, що їх модель за показниками на двох популярних тестах — AIME та MATH — відповідає OpenAI o1.
Користувачі, які вже скористалися можливістю потестувати нову модель, відмічають, що DeepSeek-R1 може бути легко обманутий, ігноруючи захисні механізми. Один з користувачів отримав від моделі рецепт заборонених речин. Крім того, DeepSeek-R1 блокує запити, які вважаються політично чутливими, як-от питання про китайського лідера Сі Цзіньпіна або площу Тяньаньмень. Це, ймовірно, наслідок тиску з боку китайського уряду, який вимагає, щоб моделі відповідали «основним соціалістичним цінностям».
DeepSeek планує відкрити вихідний код DeepSeek-R1 та випустити API. Це підтримується High-Flyer Capital Management, китайським хедж-фондом, що використовує ШІ для прийняття торгових рішень.