Французька компанія Mistral AI презентувала нову лінійку моделей ШІ Mistral 3, орієнтовану на розробників, підприємства та спільноту відкритого коду. До сімейства увійшли компактні моделі з 3, 8 та 14 мільярдами параметрів, а також флагманська Mistral Large 3, яка має архітектуру зі змішаними експертами та активними 41 мільярдом параметрів. Усі моделі доступні під ліцензією Apache 2.0 і вже представлені на таких платформах, як Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, Modal, IBM WatsonX, OpenRouter, Fireworks, Unsloth AI та Together AI.

Mistral Large 3 навчали на 3 000 графічних процесорах NVIDIA H200, використовуючи технології Blackwell attention та mixture-of-experts kernels. Це дозволило досягти високих результатів у багатомовних та мультимодальних завданнях. Моделі Mistral 3 пропонують базові, інструктивні та логічні варіанти, кожен з яких підтримує розпізнавання зображень і поєднання ціни та продуктивності.
Моделі доступні у форматі NVFP4, оптимізованому для vLLM та обладнання NVIDIA, що забезпечує ефективну роботу як у дата-центрах, так і на пристроях на межі мережі. Завдяки відкритим вагам і широкій підтримці мов ці моделі легко адаптуються до різних робочих процесів і підходять для індивідуальних налаштувань у компаніях.
Mistral AI активно співпрацює з NVIDIA, Red Hat і vLLM для покращення навчання та впровадження своїх рішень. Представники галузі відзначають відкритість коду, багатомовність і гнучкість моделей як ключові переваги нової лінійки для розробників і корпоративних користувачів.


