Китайська компанія Moonshot AI представила відкриту мовну модель Kimi-K2, яка має один трильйон параметрів і створена для виконання складних завдань без спеціального модуля логічного мислення. Модель побудована за принципом «mixture-of-experts», активуючи 32 мільярди параметрів для кожного запиту. Kimi-K2 доступна у двох версіях: «Kimi-K2-Base» для досліджень та налаштування, і «Kimi-K2-Instruct» для спілкування та агентських сценаріїв.
На стандартних тестах для мовних моделей Kimi-K2-Instruct показала результати, які дорівнюють або перевищують показники закритих продуктів. Наприклад, на SWE-bench Verified модель досягла 65,8% в режимі агента, обійшовши GPT-4.1 і наблизившись до Claude Sonnet 4. Kimi-K2 також лідирує у тестах LiveCodeBench та OJBench, що оцінюють здатність вирішувати програмістські завдання.
Модель демонструє сильні результати у математиці й природничих науках, перевершуючи конкурентів на таких випробуваннях, як AIME, GPQA-Diamond і MATH-500. У неофіційному тесті Kimi-K2 змогла створити деталізований SVG-малюнок, впоравшись із завданням, яке часто стає складним для інших ШІ.
Moonshot AI заявляє, що Kimi-K2 оптимізована для агентських сценаріїв: вона може виконувати команди, викликати зовнішні інструменти, писати та налагоджувати код, а також вирішувати комплексні багатокрокові задачі без втручання людини. Модель довела свою ефективність під час демонстрацій, де самостійно аналізувала дані, проводила статистичні обрахунки й формувала інтерактивні сторінки.
Модель доступна через API, сумісний із OpenAI, а також для локального запуску з використанням популярних рушіїв. Вартість використання стартує від $0,15 за обробку мільйона вхідних токенів для кешованих запитів. Для розгортання Kimi-K2 потрібне потужне обладнання, але для дослідницьких цілей доступні інструкції для локального запуску. Ліцензія базується на MIT і містить вимогу про відображення назви «Kimi K2» для дуже великих проєктів.