DeepSeekMath-V2 показала результаты на уровне золотых медалистов Международной математической олимпиады 2025 года и Китайской математической олимпиады 2024 года. Результаты описаны в препринте, опубликованном на сервере arXiv.
DeepSeek научился находить и проверять свои математические доказательства


Особенность модели — система самопроверки математических доказательств. В отличие от ранних подходов, которые фокусировались на правильности финального ответа, новая система оценивает корректность логических рассуждений на каждом шаге. Модель включает верификатор, который анализирует математические доказательства и выявляет логические ошибки, а мета-система проверяет точность работы самого верификатора. Модель создает решения и оценивает собственную работу, совершенствуя аргументацию до устранения всех проблем.
Трудная математика пока не поддается искусственному интеллекту

«Мы находимся в точке, где ИИ справляется с математикой так же хорошо, как умный студент-бакалавр», — говорит Кевин Баззард, математик из Имперского колледжа Лондона.
Система решила пять из шести задач Международной математической олимпиады 2025 года (83,3%), хотя самые сложные задачи остались нерешенными. Math-V2 использует самопроверку на естественном языке, что снижает потребность в участии человека и делает модель более экономичной по сравнению с конкурентами, такими как Gemini Deep Think, которая использует внешний символьный язык Lean.
Math-V2 — одна из немногих моделей такого уровня с открытыми весами, доступная для свободного скачивания и обучения исследователями.
