DeepSeek lança modelo Prover-V2: Parâmetros 671B impulsionam a prova de teoremas matemáticos

A DeepSeek lançou o modelo DeepSeek-Prover2, concebido para provas matemáticas, a 1 de maio, com 671 mil milhões de parâmetros e uma versão com 7 mil milhões de parâmetros. O modelo usa uma combinação de recursão e aprendizagem por reforço para se destacar em vários testes de matemática, como o teste MiniFF com uma taxa de aprovação de 88,9%. O conjunto de dados ProBench lançado ao mesmo tempo contém 325 perguntas para avaliar as capacidades do modelo. As experiências revelaram que o modelo Chain of Thought melhora significativamente a precisão, com o mini-modelo a superar mesmo o modelo em problemas específicos. O modelo já se encontra na Hugging Face, apoiando um novo paradigma na investigação matemática.