Команда Qwen від Alibaba представила одразу чотири нові відкриті генеративні моделі ШІ, серед яких головною стала Qwen3-235B-A22B-Thinking-2507. Ця модель спеціалізується на завданнях, що потребують логічного мислення та аналізу, і показує одні з найкращих результатів на основних тестах продуктивності. На AIME25, що оцінює математичні та логічні здібності, Qwen3-Thinking-2507 посіла перше місце серед усіх відкритих і закритих моделей. На інших бенчмарках, включаючи LiveCodeBench v6, GPQA та Arena-Hard v2, вона також випереджає конкурентів або займає лідируючі позиції.
🚀 We’re excited to introduce Qwen3-235B-A22B-Thinking-2507 — our most advanced reasoning model yet!
— Qwen (@Alibaba_Qwen) July 25, 2025
Over the past 3 months, we’ve significantly scaled and enhanced the thinking capability of Qwen3, achieving:
✅ Improved performance in logical reasoning, math, science & coding… pic.twitter.com/vO6UHlW7pf
Qwen3-Thinking-2507 побудована як окрема модель для складних завдань мислення, на відміну від попередніх гібридних підходів, де користувачі самостійно перемикали режими роботи. Таке розділення дозволяє досягати більш стабільних і зрозумілих відповідей, а також покращує результати на тестах. Окрім цієї моделі, команда Qwen презентувала Qwen3-Coder-480B-A35B-Instruct для програмування та Qwen3-MT для багатомовного перекладу, які теж доступні з відкритим кодом.
Усі нові моделі поширюються за ліцензією Apache 2.0, що дозволяє компаніям вільно завантажувати, змінювати, розміщувати та інтегрувати ШІ у власні продукти без обмежень. Qwen3-Thinking-2507 можна завантажити безкоштовно через Hugging Face, ModelScope або скористатися API Alibaba Cloud. Для підприємств доступні тарифи: $0.70 за мільйон вхідних токенів та $8.40 за мільйон вихідних токенів, а безкоштовний пакет включає мільйон токенів протягом 180 днів.
Модель підтримує інтеграцію з агентними фреймворками через Qwen-Agent, сумісна з OpenAI-API, може запускатися локально або через Node.js, CLI та інші інтерфейси. Для найкращих результатів рекомендується використовувати temperature=0.6, top_p=0.95 та максимальну довжину відповіді до 81920 токенів.
Qwen3-Thinking-2507 підходить для корпоративних систем підтримки прийняття рішень, планування і аналітики. Вся лінійка Qwen3, включаючи засоби кодування, інструкції та перекладу, орієнтована на впровадження ШІ у різних сферах бізнесу, технічних командах і службах підтримки.