ディープシーク、Prover-V2モデルをリリース:671Bパラメータが数学的定理証明を強化

DeepSeekは5月1日、数学証明用に設計されたDeepSeek-Prover2モデルをオープンソース化した。このモデルには6710億のパラメータと70億のパラメータ・バージョンが含まれている。このモデルは、再帰と強化学習の組み合わせを使用し、合格率88.9%のMiniFFテストなど、いくつかの数学テストで優れた成績を収めている。 同時に公開されたProBenchデータセットには、モデルの能力を評価するための325問が含まれている。実験の結果、Chain of Thoughtモデルは精度を大幅に向上させ、特定の問題ではミニモデルが上回ることさえ判明している。このモデルはすでにHugging Faceにあり、数学研究の新しいパラダイムを支えている。