Система штучного інтелекту, розроблена лабораторією Google DeepMind, перевершила середнього золотого медаліста у вирішенні геометричних задач на міжнародному математичному конкурсі. Нова версія системи, названа AlphaGeometry2, здатна розв’язувати 84% усіх геометричних задач, які з’являлися на Міжнародній математичній олімпіаді (IMO) за останні двадцять п’ять років.
AlphaGeometry2 використовує модель мови з родини моделей Gemini від Google та «символьний двигун». Модель Gemini допомагає рушію, який використовує математичні правила для виведення рішень задач, знаходити можливі докази для заданої геометричної теореми. Випробування системи показали, що вона успішно розв’язала 42 з 50 задач, перевершуючи середній результат золотих медалістів, що становить 40,9 бала.
Однак, AlphaGeometry2 має свої обмеження. Вона не може вирішувати задачі з змінною кількістю точок, нелінійними рівняннями та нерівностями. Крім того, система показала гірші результати на складніших задачах, які були запропоновані для IMO, але ще не з’явилися на конкурсі. З 29 таких задач AlphaGeometry2 змогла розв’язати лише 20.
Незважаючи на це, результати дослідження викликають інтерес до комбінованого підходу, що поєднує маніпуляцію символами та нейронні мережі. За словами дослідників DeepMind, модель AlphaGeometry2 демонструє перспективність такого підходу у пошуках універсальних ШІ-систем. Це підкріплюється тим, що інші нейронні мережі, такі як o1, не змогли розв’язати жодної з задач, які підкорила AlphaGeometry2.