26.07.2025, 12:13

ИИ-модель Google DeepMind показала уровень золотых медалистов на Международной математической олимпиаде 2025

Ученые Google DeepMind разработали систему Deep Think, которая решила задачи Международной математической олимпиады на уровне золотой медали, набрав 35 из 42 баллов. Больше баллов среди участников людей набрали 26 человек. По утверждению компании OpenAI ее модель тоже справилась с задачами Олимпиады на уровне золотой медали, но эти решения не были проверены жюри олимпиады, а оценивались независимыми экспертами. Блестяще выступили на Олимпиаде российские школьники — они получили 5 золотых и 1 серебряную медаль.

Владимир Губайловский

Теги:

Искусственный интеллект

Математика

Нейронауки

ИИ-модель Google DeepMind показала уровень золотых медалистов на Международной математической олимпиаде 2025

Золотая медаль ИИ. MoiraM/Alamy

На первый взгляд не велика честь превзойти школьников в решении задач по элементарной математике. Но это не так. Победителями Олимпиады становятся выдающиеся математические таланты со всего мира. На Олимпиаде побеждали Григорий Перельман, Теренс Тао и многие лауреаты Филдсовской премии. Большинство из них очень рано становятся профессорами ведущих университетов, многие определяют будущее математики. Сами задачи составляют ведущие математики мира, и решение требует не столько обширных знаний, сколько выдающейся изобретательности и сосредоточенности. То, с чем победители Олимпиады справляются за часы, сильным профессионалам поддается за дни, и то не всегда. Но есть и еще один момент: решение задач требует умения рассуждать и делать глубокие выводы. Вот это и проверяли в первую очередь, когда тестировали на этих задачах ИИ-модели.

21 июля Google DeepMind объявила о революционном прорыве: их программное обеспечение справилось с задачами Международной математической олимпиады на уровне лучших школьников мира, получив золотую медаль. На первый взгляд, это лишь незначительное улучшение по сравнению с прошлым годом, когда система показала результат на уровне серебряной медали. Однако за оценками этого года скрывается «большой сдвиг».

Ранее компания достигала успехов, используя два специализированных инструмента искусственного интеллекта — AlphaGeometry и AlphaProof, предназначенных для выполнения строгих логических шагов в математических доказательствах. Процесс требовал от экспертов-людей сначала перевести условия задач в нечто похожее на язык программирования, а затем перевести решения ИИ обратно на английский язык.

«В этом году все работает на естественном языке, от начала до конца», — заявил Тханг Луонг, специалист по информатике из DeepMind. Команда использовала большую языковую модель Deep Think, основанную на системе Gemini, но с дополнительными разработками, которые сделали ее лучше и быстрее в создании математических аргументов. «Долгое время я не думал, что мы сможем зайти так далеко с большими языковыми моделями», — добавил Луонг.

Deep Think набрала 35 из 42 баллов по 6 задачам этой олимпиады. По соглашению с организаторами, решения компьютера оценивались теми же судьями, что и работы участников-людей. Отдельно OpenAI из Сан-Франциско также достигла золотого уровня своей языковой моделью, но оценивалась независимо.

Два мира ИИ

Долгие годы исследователи ИИ разделялись на два лагеря. До 2012 года ведущим подходом было ручное кодирование правил логического мышления. С тех пор нейронные сети, которые обучаются автоматически на огромных массивах данных, совершили серию сенсационных прорывов.

Гэри Маркус, нейроученый из Нью-Йоркского университета и сторонник нейросимволического ИИ, назвал результаты DeepMind и OpenAI «ужасно впечатляющими». Он отметил, что способность решать математические задачи на уровне 67 лучших школьников мира означает действительно хорошие математические навыки.

Пока неясно, останется ли превосходство больших языковых моделей в задачах олимпиады или нейросимволический ИИ вернет себе лидерство. Системы вроде AlphaProof имеют преимущество в том, что могут сертифицировать правильность своих доказательств, тогда как доказательства языковых моделей должны проверяться людьми.

Математик Кевин Баззард из Имперского колледжа Лондона отметил, что успех на математической олимпиаде не обязательно означает готовность к серьезным исследованиям. Остается открытым вопрос, смогут ли талантливые ИИ решать реальные исследовательские задачи. DeepMind планирует предоставить исследователям доступ к версии Deep Think. «Очень скоро ИИ сможет сотрудничать с математиками», — заключил Луонг.