Google представила модель Gemini 2.5 Flash для розробників

Система дозволяє гнучко налаштовувати рівень аналізу запитів і оптимізувати витрати при роботі з великими обсягами даних

Eleni Karasidi

Опубліковано: 19.04.2025

Новини

Ілюстративне зображення

Google презентувала попередню версію своєї нової генеративної ШІ-моделі Gemini 2.5 Flash, яка вже доступна для тестування через Gemini API, Google AI Studio та Vertex AI. Модель орієнтована на розробників і команди, яким потрібна обробка великих обсягів запитів у чатах або створення рішень для роботи в реальному часі. Gemini 2.5 Flash підтримує текст, зображення, відео та аудіо, а також забезпечує контекстне вікно до одного мільйона токенів.

Gemini 2.5 Flash just dropped. ⚡

As a hybrid reasoning model, you can control how much it ‘thinks’ depending on your 💰 – making it ideal for tasks like building chat apps, extracting data and more.

Try an early version in @Google AI Studio → https://t.co/iZJNqQmooH pic.twitter.com/gUKbK5x3yZ
— Google DeepMind (@GoogleDeepMind) April 17, 2025

У цій моделі впроваджено гібридний режим роботи — розробники можуть самостійно визначати рівень «мислення» моделі, тобто скільки ресурсів вона витрачатиме на аналіз запиту. Це дозволяє оптимізувати баланс між швидкістю, якістю відповіді та вартістю використання. Якщо ввімкнути розширене мислення, вартість вихідних токенів зростає з шістдесяти центів до трьох доларів п’ятдесяти центів за мільйон токенів, а розробники можуть задавати ліміт «thinking_budget» від нуля до двадцяти чотирьох тисяч п’ятсот сімдесяти шести токенів.

Gemini 2.5 Flash демонструє високу продуктивність у складних завданнях, поступаючись лише Gemini 2.5 Pro на тесті Hard Prompts. На альтернативному бенчмарку Humanity’s Last Exam ця модель випередила конкурентів, таких як Claude 3.7 Sonnet і DeepSeek R1, проте поступилася OpenAI o4-mini. Відзначається, що для простих запитів модель самостійно визначає, чи потрібне додаткове мислення, що дозволяє заощаджувати час і ресурси.

Нова модель особливо корисна для створення чат-ботів, інструментів для автоматизованого видобування даних й інших рішень, де важливі швидкість обробки та контроль витрат. Google підкреслює, що Gemini 2.5 Flash — найбільш економічна у своїй лінійці, а її функціональність буде розширюватися в процесі тестування до загального доступу.