Google DeepMind оголосила , що їхня система Gemini Deep Think досягла рівня золотої медалі на Міжнародній математичній олімпіаді 2025 року. Модель змогла розв’язати п’ять із шести складних задач з алгебри, комбінаторики, геометрії та теорії чисел, набравши 35 балів із 42 можливих. Всі рішення були написані природною мовою, перевірені офіційними суддями IMO й описані як чіткі та зрозумілі. Gemini Deep Think працювала у спеціальному режимі, що дозволяє паралельно розглядати кілька гіпотез перед формуванням остаточної відповіді, і виконала завдання у межах стандартного часу без зовнішніх інструментів.
Команда DeepMind навчала модель із використанням підкріплювального навчання, надаючи їй доступ до ретельно відібраних рішень попередніх олімпіад і рекомендацій щодо підходів до таких задач. Це дозволило Gemini знаходити різні шляхи розв’язання та комбінувати їх для отримання повного доказу. DeepMind планує дати математичній спільноті можливість протестувати цю версію моделі, а згодом відкрити її для підписників Google AI Ultra.
Водночас OpenAI заявила , що їхня експериментальна мовна модель також здобула золото на IMO, розв’язавши п’ять із шести задач у стандартних умовах. Модель працювала без доступу до інтернету чи зовнішніх інструментів, а всі докази у текстовій формі оцінювали колишні переможці олімпіади. За словами дослідників OpenAI, ця модель не була спеціально натренована для IMO, а розвивалася як універсальна система міркувань із акцентом на стійку роботу протягом багатьох годин.
Успіх обох компаній свідчить, що сучасні мовні моделі можуть розв’язувати складні математичні задачі, використовуючи лише природну мову без спеціалізованих програмних засобів. Для користувачів це означає, що подібні ШІ вже здатні підтримувати тривалі розумові процеси, пропонувати повні докази та можуть стати інструментом для дослідників, освітян і ентузіастів математики. DeepMind планує й надалі вдосконалювати Gemini для наступних олімпіад і ширшого застосування.