DeepSeek выпускает модель Prover-V2: параметры 671B повышают эффективность математического доказательства теорем

1 мая компания DeepSeek выложила в открытый доступ модель DeepSeek-Prover2, предназначенную для математических доказательств и содержащую 671 миллиард параметров, а также версию с 7 миллиардами параметров. Модель использует комбинацию рекурсии и обучения с подкреплением, что позволяет ей успешно справляться с несколькими математическими тестами, например с тестом MiniFF с показателем 88,9%. Выпущенный тогда же набор данных ProBench содержит 325 вопросов для оценки возможностей модели. Эксперименты показали, что модель Chain of Thought значительно повышает точность, а мини-модель даже превосходит ее по отдельным задачам. Модель уже находится в Hugging Face, поддерживая новую парадигму в математических исследованиях.