Команда Qwen із Alibaba презентувала QwQ-32B-Preview — нову «логічну» модель ШІ, яка доступна для завантаження під відкритою ліцензією Apache 2.0. Ця модель містить 32,5 мільярда параметрів і може обробляти контекст довжиною до 32 тисяч слів. У деяких тестах, таких як AIME і MATH, вона перевершує OpenAI o1-preview і o1-mini.
QwQ-32B-Preview розроблена для вирішення складних логічних задач і математичних прикладів. За словами розробників, її ключова перевага — здатність «перевіряти» свої відповіді, покращуючи точність. Проте цей підхід потребує більше часу для обчислень. Модель також може виконувати багатокрокові завдання, плануючи розв’язання.
Модель має певні обмеження. Вона може перемикатися між мовами або допускати циклічне мислення, через що відповідь іноді виявляється надто довгою. Водночас QwQ-32B-Preview уникає дискусій на політичні теми, що є типовим для моделей китайських компаній.
Хоча модель можна завантажити з платформи Hugging Face, деякі її компоненти залишаються недоступними. Це обмежує можливість повного вивчення чи відтворення QwQ-32B-Preview.