DeepMind, дослідницька лабораторія Google у сфері ШІ, представила нову систему під назвою «AlphaEvolve», яка допомагає вирішувати завдання з так званими «машинно-оцінюваними» відповідями. За словами компанії, система вже продемонструвала ефективність під час оптимізації інфраструктури, яку Google використовує для навчання власних моделей ШІ. Наразі команда розробляє інтерфейс для взаємодії з «AlphaEvolve» та планує запустити програму раннього доступу для окремих науковців, перш ніж розширити доступ до ширшої аудиторії.
Ключова особливість «AlphaEvolve» — автоматична система оцінки відповідей, що дозволяє зменшити кількість помилкових відповідей, які часто трапляються у сучасних ШІ-моделях. Система генерує декілька варіантів відповідей, самостійно їх аналізує та відбирає найточніші. Для роботи користувач має сформулювати задачу й надати механізм автоматичної перевірки рішень, наприклад формулу.
«AlphaEvolve» найкраще підходить для завдань, які можна оцінити автоматично — зокрема у сферах комп’ютерних наук та оптимізації систем. Водночас, система може описувати рішення лише у вигляді алгоритмів, тому не підходить для завдань, які не мають числового характеру.
У тестах DeepMind система вирішила близько п’ятдесяти математичних завдань, відтворивши найкращі відомі рішення у трьох чвертях випадків та запропонувавши покращення у кожному п’ятому завданні. На практиці «AlphaEvolve» допомогла підвищити ефективність дата-центрів Google, відновлюючи у середньому нуль цілих сім десятих відсотка обчислювальних ресурсів, а також скоротила час навчання моделей Gemini на один відсоток.