DeepSeek, китайський стартап у сфері штучного інтелекту, здивував світ своїми новими моделями Janus-Pro. Компанія заявляє, що ці моделі можуть перевершити відомі DALL-E 3 від OpenAI. Janus-Pro доступна для завантаження на платформі Hugging Face і має від одного до семи мільярдів параметрів. Це означає, що моделі здатні вирішувати складні завдання, адже, як правило, більше параметрів означають кращу продуктивність.

Janus-Pro може аналізувати та створювати нові зображення. Згідно з DeepSeek, найбільша модель Janus-Pro-7B перевершує DALL-E 3. Незважаючи на те, що більшість моделей Janus-Pro можуть аналізувати лише невеликі зображення з роздільною здатністю до 384×384, їхня продуктивність вражає.
DeepSeek також привертає увагу своїми відкритими моделями, які, за словами компанії, можна навчати за менші кошти і з використанням меншої кількості графічних процесорів. Це змусило багатьох аналітиків сумніватися, чи може США зберегти лідерство в гонці ШІ. На тлі цього, акції Nvidia впали на 17 відсотків, що стало найбільшим падінням в історії США, за даними CNBC.
DeepSeek обмежив реєстрацію нових користувачів через великомасштабні атаки на свої сервіси. Однак, існуючі користувачі можуть увійти в систему без проблем. Це обмеження викликало додатковий інтерес до компанії, яка вже підкорила вершини App Store зі своїм AI-помічником.