Google DeepMind представила нову колекцію генеративних моделей під назвою Gemma 3, яка доступна для роботи на різноманітних пристроях, включаючи смартфони, ноутбуки та робочі станції. Ця колекція включає полегшені моделі, які відзначаються високою швидкістю та продуктивністю, що робить їх ідеальними для використання на одному GPU або TPU. Gemma 3 підтримує понад 140 мов та пропонує розширені можливості текстового та візуального аналізу, що відкриває нові можливості для створення інтерактивних та інтелектуальних додатків.
Серед нових функцій Gemma 3 — можливість обробляти складні завдання завдяки розширеному контекстному вікну на 128 тисяч токенів та підтримка виклику функцій для автоматизації процесів. Моделі Gemma 3 також представлені у квантизованих версіях, що забезпечує швидшу продуктивність та знижені вимоги до обчислювальних ресурсів. Це дозволяє користувачам адаптувати моделі до своїх потреб, використовуючи різні платформи та інструменти, такі як Hugging Face Transformers, PyTorch та інші.
Разом з Gemma 3, Google DeepMind запустила ShieldGemma 2 — інструмент для перевірки безпеки зображень, що забезпечує автоматичне маркування контенту за трьома категоріями безпеки: небезпечний, сексуально відвертий та насильницький. Це дозволяє розробникам налаштовувати інструмент відповідно до своїх потреб, забезпечуючи безпечний розвиток ШІ-рішень. ShieldGemma 2 побудований на основі Gemma 3, що надає йому високу ефективність та гнучкість.
Gemma 3 легко інтегрується в існуючі робочі процеси, пропонуючи різноманітні варіанти розгортання, включаючи Vertex AI, Cloud Run та локальні середовища. Це забезпечує користувачам можливість швидкого початку роботи з моделями, їхньої адаптації та розгортання на різних апаратних платформах. Gemma 3 оптимізована для роботи на GPU від NVIDIA та інтегрується з AMD GPU через ROCm™ stack, що робить її доступною для широкого кола користувачів та розробників.