ИИ-модель Google DeepMind показала уровень золотых медалистов на Международной математической олимпиаде 2025

Ученые Google DeepMind разработали систему Deep Think, которая решила задачи Международной математической олимпиады на уровне золотой медали, набрав 35 из 42 баллов. Больше баллов среди участников людей набрали 26 человек. По утверждению компании OpenAI ее модель тоже справилась с задачами Олимпиады на уровне золотой медали, но эти решения не были проверены жюри олимпиады, а оценивались независимыми экспертами. Блестяще выступили на Олимпиаде российские школьники — они получили 5 золотых и 1 серебряную медаль.
Владимир Губайловский
Владимир Губайловский
ИИ-модель Google DeepMind показала уровень золотых медалистов на Международной математической олимпиаде 2025
Золотая медаль ИИ. MoiraM/Alamy
На первый взгляд не велика честь превзойти школьников в решении задач по элементарной математике. Но это не так. Победителями Олимпиады становятся выдающиеся математические таланты со всего мира. На Олимпиаде побеждали Григорий Перельман, Теренс Тао и многие лауреаты Филдсовской премии. Большинство из них очень рано становятся профессорами ведущих университетов, многие определяют будущее математики. Сами задачи составляют ведущие математики мира, и решение требует не столько обширных знаний, сколько выдающейся изобретательности и сосредоточенности. То, с чем победители Олимпиады справляются за часы, сильным профессионалам поддается за дни, и то не всегда. Но есть и еще один момент: решение задач требует умения рассуждать и делать глубокие выводы. Вот это и проверяли в первую очередь, когда тестировали на этих задачах ИИ-модели.

21 июля Google DeepMind объявила о революционном прорыве: их программное обеспечение справилось с задачами Международной математической олимпиады на уровне лучших школьников мира, получив золотую медаль. На первый взгляд, это лишь незначительное улучшение по сравнению с прошлым годом, когда система показала результат на уровне серебряной медали. Однако за оценками этого года скрывается «большой сдвиг».

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Ранее компания достигала успехов, используя два специализированных инструмента искусственного интеллекта — AlphaGeometry и AlphaProof, предназначенных для выполнения строгих логических шагов в математических доказательствах. Процесс требовал от экспертов-людей сначала перевести условия задач в нечто похожее на язык программирования, а затем перевести решения ИИ обратно на английский язык.

Что изменилось
Что изменилось
Google DeepMind
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

«В этом году все работает на естественном языке, от начала до конца», — заявил Тханг Луонг, специалист по информатике из DeepMind. Команда использовала большую языковую модель Deep Think, основанную на системе Gemini, но с дополнительными разработками, которые сделали ее лучше и быстрее в создании математических аргументов. «Долгое время я не думал, что мы сможем зайти так далеко с большими языковыми моделями», — добавил Луонг.

Deep Think набрала 35 из 42 баллов по 6 задачам этой олимпиады. По соглашению с организаторами, решения компьютера оценивались теми же судьями, что и работы участников-людей. Отдельно OpenAI из Сан-Франциско также достигла золотого уровня своей языковой моделью, но оценивалась независимо.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Два мира ИИ

Математика в представлении ИИ
Математика в представлении ИИ
Google DeepMind

Долгие годы исследователи ИИ разделялись на два лагеря. До 2012 года ведущим подходом было ручное кодирование правил логического мышления. С тех пор нейронные сети, которые обучаются автоматически на огромных массивах данных, совершили серию сенсационных прорывов.

Гэри Маркус, нейроученый из Нью-Йоркского университета и сторонник нейросимволического ИИ, назвал результаты DeepMind и OpenAI «ужасно впечатляющими». Он отметил, что способность решать математические задачи на уровне 67 лучших школьников мира означает действительно хорошие математические навыки.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Пока неясно, останется ли превосходство больших языковых моделей в задачах олимпиады или нейросимволический ИИ вернет себе лидерство. Системы вроде AlphaProof имеют преимущество в том, что могут сертифицировать правильность своих доказательств, тогда как доказательства языковых моделей должны проверяться людьми.

Математик Кевин Баззард из Имперского колледжа Лондона отметил, что успех на математической олимпиаде не обязательно означает готовность к серьезным исследованиям. Остается открытым вопрос, смогут ли талантливые ИИ решать реальные исследовательские задачи. DeepMind планирует предоставить исследователям доступ к версии Deep Think. «Очень скоро ИИ сможет сотрудничать с математиками», — заключил Луонг.