Китайська компанія DeepSeek тестує ШІ-конкурента OpenAI o1

DeepSeek-R1 перевіряє себе, уникає помилок, але має труднощі з логікою та політичними запитами.

Опубліковано: 20.11.2024

Китайська лабораторія DeepSeek представила новий «модуль мислення» ШІ, який може конкурувати з OpenAI o1. DeepSeek-R1, як стверджують розробники, здатний ефективно перевіряти себе, витрачаючи більше часу на обдумування запитів. Це допомагає уникати типових помилок, які трапляються у моделях.

🚀 DeepSeek-R1-Lite-Preview is now live: unleashing supercharged reasoning power!

🔍 o1-preview-level performance on AIME & MATH benchmarks.
💡 Transparent thought process in real-time.
🛠️ Open-source models & API coming soon!

🌐 Try it now at https://t.co/v1TFy7LHNy #DeepSeek pic.twitter.com/saslkq4a1s
— DeepSeek (@deepseek_ai) November 20, 2024

Подібно до o1, DeepSeek-R1 виконує завдання шляхом планування та виконання дій, що допомагають дійти до відповіді. Залежно від складності запитання, DeepSeek-R1 може «думати» протягом кількох десятків секунд. DeepSeek стверджує, що їх модель за показниками на двох популярних тестах — AIME та MATH — відповідає OpenAI o1.

Користувачі, які вже скористалися можливістю потестувати нову модель, відмічають, що DeepSeek-R1 може бути легко обманутий, ігноруючи захисні механізми. Один з користувачів отримав від моделі рецепт заборонених речин. Крім того, DeepSeek-R1 блокує запити, які вважаються політично чутливими, як-от питання про китайського лідера Сі Цзіньпіна або площу Тяньаньмень. Це, ймовірно, наслідок тиску з боку китайського уряду, який вимагає, щоб моделі відповідали «основним соціалістичним цінностям».

DeepSeek планує відкрити вихідний код DeepSeek-R1 та випустити API. Це підтримується High-Flyer Capital Management, китайським хедж-фондом, що використовує ШІ для прийняття торгових рішень.