21 июля Google DeepMind объявила о революционном прорыве: их программное обеспечение справилось с задачами Международной математической олимпиады на уровне лучших школьников мира, получив золотую медаль. На первый взгляд, это лишь незначительное улучшение по сравнению с прошлым годом, когда система показала результат на уровне серебряной медали. Однако за оценками этого года скрывается «большой сдвиг».
ИИ-модель Google DeepMind показала уровень золотых медалистов на Международной математической олимпиаде 2025

Ранее компания достигала успехов, используя два специализированных инструмента искусственного интеллекта — AlphaGeometry и AlphaProof, предназначенных для выполнения строгих логических шагов в математических доказательствах. Процесс требовал от экспертов-людей сначала перевести условия задач в нечто похожее на язык программирования, а затем перевести решения ИИ обратно на английский язык.

«В этом году все работает на естественном языке, от начала до конца», — заявил Тханг Луонг, специалист по информатике из DeepMind. Команда использовала большую языковую модель Deep Think, основанную на системе Gemini, но с дополнительными разработками, которые сделали ее лучше и быстрее в создании математических аргументов. «Долгое время я не думал, что мы сможем зайти так далеко с большими языковыми моделями», — добавил Луонг.
Deep Think набрала 35 из 42 баллов по 6 задачам этой олимпиады. По соглашению с организаторами, решения компьютера оценивались теми же судьями, что и работы участников-людей. Отдельно OpenAI из Сан-Франциско также достигла золотого уровня своей языковой моделью, но оценивалась независимо.
Два мира ИИ

Долгие годы исследователи ИИ разделялись на два лагеря. До 2012 года ведущим подходом было ручное кодирование правил логического мышления. С тех пор нейронные сети, которые обучаются автоматически на огромных массивах данных, совершили серию сенсационных прорывов.
Гэри Маркус, нейроученый из Нью-Йоркского университета и сторонник нейросимволического ИИ, назвал результаты DeepMind и OpenAI «ужасно впечатляющими». Он отметил, что способность решать математические задачи на уровне 67 лучших школьников мира означает действительно хорошие математические навыки.
Пока неясно, останется ли превосходство больших языковых моделей в задачах олимпиады или нейросимволический ИИ вернет себе лидерство. Системы вроде AlphaProof имеют преимущество в том, что могут сертифицировать правильность своих доказательств, тогда как доказательства языковых моделей должны проверяться людьми.
Математик Кевин Баззард из Имперского колледжа Лондона отметил, что успех на математической олимпиаде не обязательно означает готовность к серьезным исследованиям. Остается открытым вопрос, смогут ли талантливые ИИ решать реальные исследовательские задачи. DeepMind планирует предоставить исследователям доступ к версии Deep Think. «Очень скоро ИИ сможет сотрудничать с математиками», — заключил Луонг.