ИИ-модель завоевала золотую медаль на математической олимпиаде / Хабр

Компания DeepSeek объявила, что её новая модель DeepSeekMath-V2 достигла уровня золотой медали на Международной математической олимпиаде (IMO), что, по мнению разработчиков, позволяет ей конкурировать с ведущими западными лабораториями в области искусственного интеллекта.

По данным стартапа, модель показала результаты, соответствующие золотым медалям IMO 2025 и Китайской математической олимпиаде (CMO) 2024. В конкурсе Патнэма ИИ заработал 118 баллов из 120.

В технической документации DeepSeek указано, что предыдущие ИИ-модели часто давали правильные ответы, не показывая верные промежуточные этапы. Для решения этой проблемы в DeepSeekMath-V2 внедрён многоступенчатый процесс проверки: верификатор подтверждает правильность доказательства, а метаверификатор анализирует саму проверку. Такой подход позволяет системе самостоятельно проверять и улучшать свои ответы в реальном времени.

Также стоит отметить, что в статье не упоминается о применении внешних инструментов, таких как калькуляторы или интерпретаторы кода. Архитектура модели предполагает, что все тесты проводятся исключительно на естественном языке. В экспериментах одна и та же модель DeepSeekMath-V2 генерирует доказательства и проверяет их. Эффективность вызывается способностью ИИ анализировать и улучшать свои решения без использования внешнего математического программного обеспечения.

Для решения особенно сложных задач система проводит масштабирование вычислений во время тестирования, одновременно подбирая и проверяя множество возможных доказательств, чтобы с высокой вероятностью получить правильный ответ. Технически модель основывается на архитектуре DeepSeek-V3.2-Exp-Base.

 DeepseekMath-V2 полностью решила пять из шести задач IMO 2025 и четыре задачи CMO 2024. На конкурсе Putnam 2024 модель полностью решила одиннадцать задач и получила частичное решение ещё одной

DeepseekMath-V2 успешно решила пять из шести задач IMO 2025 и четыре задачи CMO 2024. На конкурсе Putnam 2024 модель полностью решила одиннадцать задач и д partially solved another.


Делегируйте часть рутинных задач с помощью BotHub! Для доступа к сервису VPN не требуется, и можно использовать российскую карту. По ссылке вы получаете 100 000 бесплатных токенов для первых задач и можете начать работу с нейросетями прямо сейчас!

Источник

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

Основатель более 10 стартапов в области ИТ и ИИ. Серийный предприниматель. Профессиональный управленец.