Grok 4: O modelo de IA "mais inteligente" de Musk construído com 200.000 GPUs

A 10 de julho, hora de Pequim, após uma hora de espera pela atenção do mundo, Musk revelou finalmente o mistério da mais recente obra-prima da xAI - o Grok 4, a que Musk chamou "a IA mais inteligente do mundo". Este modelo, a que Musk chamou "a IA mais inteligente do mundo", estabeleceu novos recordes nos principais testes de referência assim que foi lançado e tornou-se o primeiro modelo de IA a ultrapassar a taxa de precisão de 50% no "Human Last Exam" (HLE).

Escala aritmética: entradas de formação sem precedentes

A escala do treino do Grok 4 reflecte o enorme investimento da xAI em infra-estruturas de IA, com um nível sem precedentes de atribuição de potência de computação:

Configuração da infraestrutura

Configuração do hardwareEspecificaçãoAtribuição da utilização
Clusters de pré-treino100.000 GPUs H100Formação de modelos básicos
Grupo de aprendizagem reforçada200.000 folhas de mistura H100/A100Afinação de RL e otimização da inferência
potência computacional total (TCP)Centro de Supercomputação ColossusFormação em IA para todo o processo
rácio de duração da formação100 vezes melhor do que Grok 2Iteração de aprendizagem profunda
Rácio de cálculo RL10 vezes melhor que o Grok 3Especializado em aprendizagem intensiva

Musk revelou que a xAI investe quase tanta aritmética na aprendizagem por reforço como na pré-treino, uma abordagem de treino orientada por um "motor duplo" que é extremamente rara na indústria. A equipa treinou o modelo para pensar, raciocinar e auto-corrigir-se a partir dos primeiros princípios, que é a fonte principal da capacidade de raciocínio da série Grok.

Evolução da arquitetura de formação

O paradigma de formação da família Grok sofreu uma evolução significativa:

versão do modeloPrincipais paradigmas tecnológicosAtribuição de recursos de computaçãoDescobertas fundamentais
Grok 2Previsão da próxima fichaA pré-treino básico é o principal objetivoAumentar a escala
Grok 3Pré-treino + RL preliminarAumento de 10 vezes na aritmética pré-treinoIntrodução das capacidades de raciocínio
Grok 4Fusão de ferramentas nativas + RL em grande escalaAritmética RL aumentada em mais 10 vezesUtilização de ferramentas e multi-inteligência

Arquitetura da tecnologia de base: conceção inovadora para integração nativa

Mecanismo de formação para a integração de ferramentas

A maior inovação tecnológica do Grok 4 é a integração dos recursos de uso da ferramenta diretamente no processo de treinamento, em vez da abordagem tradicional de pós-integração:

Caraterísticas técnicasProgramas tradicionaisPrograma Grok 4melhoria do desempenho
Método de invocação da ferramentaIntegração pós-APIIntegração da formação nativaAumentar a eficiência em 3-5 vezes
curva de aprendizagemPeríodo de adaptação acentuadacrescimento suaveMelhor coerência
escalabilidadelimitado pela interfaceintegração perfeitaSuporte para cadeias de ferramentas complexas
coerência de raciocíniofacilmente criticávelOtimização de ponta a pontaRedução da taxa de erro 40%

Esse design permite que o Grok 4 aprenda quando, como e por que usar ferramentas específicas durante o treinamento, em vez de simplesmente chamar APIs externas.

Sistema de Colaboração Multi-Inteligência

O Grok 4 Heavy utiliza um modo de funcionamento paralelo multi-inteligência com as seguintes especificações técnicas:

Parâmetros de colaboraçãoespecificações técnicasMecanismos de funcionamento
Número de inteligências paralelasAté 32Tratamento simultâneo da mesma questão
Estratégias de ramificação para raciocínioárvore de pesquisa profundaCada ramo é explorado de forma independente
Mecanismos de validação colaborativaAlgoritmos de validação cruzadaControlo inter-inteligências
seleção de soluções óptimasFusão de aprendizagem integradaGeração de respostas globais óptimas
Cálculo das extensões durante os ensaiosAjustável de 1× a 32×Ajusta-se dinamicamente à complexidade da tarefa

Esta "equipa de doutorandos a trabalhar em grupo" aumentou a precisão de 40% para mais de 50% para inteligências individuais.

Parâmetros de desempenho do modelo

Indicadores principaisEspecificações do Grok 4Comparação entre sectores
Comprimento do contexto256K fichasNormas de aplicações empresariais
Número da versão da APIgrok-4-0709Última versão estável
rapidez de raciocínio75 tokens/segundoPara além de Claude 4 Opus (66 fichas/segundo)
Otimização da latênciaRedução para metade de ponta a pontaInteração por voz em tempo real
processamento simultâneoSuporte para multi-utilizadores com elevada concorrênciaPronto para a comercialização
era da modelaçãoInfraestrutura de 7ª geraçãoA mais recente pilha de tecnologia da xAI

Avaliação comparativa do desempenho: Liderar a inteligência em toda a linha

Aptidões académicas e de raciocínio

O Grok 4 comprova o seu "nível pós-doutoral" de inteligência através de um bom desempenho nos testes mais prestigiados:

Categoria de testeObjectivos de referência específicosPontuação do Grok 4Grok 4 PesadoComparação dos níveis de doutoramento humano
tema geralHLE (Human Legacy Examination)38.6%44.4%Para além da maioria dos estudantes de doutoramento
concurso de matemáticaAIME25100%100%nível de nota máxima
Equipa de MatemáticaHMMT2596.7%96.7%Nível de competição superior
Perguntas e respostas para estudantes de pós-graduaçãoGPQA88.9%88.9%Nível de entrada no doutoramento
Olimpíada de MatemáticaUSAMO2561.9%61.9%Nível de competição internacional
concurso de programaçãoLCB (janeiro-maio)79.4%79.4%Nível de programador profissional

Avaliação das competências essenciais da AGI

O Grok 4 também se destacou no teste chave de IA geral:

Itens do teste AGIDesempenho do Grok 4significado técnicoComparação com os concorrentes
ARC-AGI-215.9%Primeiro modelo comercial a ultrapassar os 10%12 vezes superior ao DeepSeek R1
ARC-AGI-166.7%Capacidade de generalizar a partir de padrões conhecidosUltrapassa o GPT-4 em quase 6 pontos percentuais
rácio custo-eficáciaótimoMais inteligente por unidade de dólarRelação preço/desempenho líder na indústria

Cenários de teste especiais

Numa série de cenários de teste únicos, o Grok 4 demonstrou a capacidade de superar a IA tradicional:

cenário de testeexpressão concretaImplicações técnicas
Teste de negócio de bancada de venda automáticaPatrimónio líquido duas vezes superior ao do segundo classificadoCapacidade de decisão empresarial a longo prazo
Descoberta de medicamentos RKGO único modelo a quebrar o 10%raciocínio biomédico
Modelação física complexaSimulação bem sucedida de colisões de buracos negrosConhecimentos avançados de computação científica

Estratégia de preços e de comercialização

A xAI tem uma estratégia clara de posicionamento de topo de gama para o Grok 4:

nível de serviçoPreços mensaisPreço da taxa anualDiferenças funcionais fundamentais
SuperGrok$30$300Carroçaria Inteligente Única Edição Standard
SuperGrok Pesado$300$3,000Edição de Colaboração Multi-Inteligência

Esta estratégia de preços posiciona o Grok 4 como um serviço de IA topo de gama para empresas e utilizadores profissionais, com uma taxa anual de até CNY 21.500 para a versão Heavy.

Perspectivas de aplicação e integração na indústria

O Grok 4 será rapidamente integrado no ecossistema industrial de Musk: o assistente de voz foi integrado no mais recente firmware da Tesla e o robô Optimus será equipado com o Grok como o seu cérebro de IA. A xAI planeia lançar modelos de programação dedicados, agentes multimodais e modelos de geração de vídeo em grande escala, um após o outro, nos próximos meses, para construir uma matriz completa de produtos de IA.

O Grok 4 estabeleceu uma posição de liderança na competição de IA com a vantagem aritmética de 200.000 clusters de GPU e a inovação tecnológica da fusão de ferramentas nativas. O seu desempenho esmagador em benchmarks, especialmente em tarefas complexas que requerem raciocínio profundo, marca um passo significativo em direção à "super inteligência humana". Embora o seu preço elevado limite a sua popularidade, o Grok 4 oferece a opção mais poderosa do mercado atual para utilizadores profissionais que procuram o máximo em poder de IA.

Se pretender utilizar a conta exclusiva paga oficial GPT Plus, Claude Pro, Grok Super, pode contactar a nossa equipa de profissionais (wx: f15303420735) se não souber como efetuar o carregamento.

Para mais produtos, consultar

Ver mais em

ShirtAI - Inteligência penetrante O Grande Modelo do AIGC: inaugurando uma era de dupla revolução na engenharia e na ciência - Penetrating Intelligence
1:1 Restauração de Claude e GPT Site oficial - AI Cloud Native Aplicação de jogos em direto Leitor de visualização de desporto HD global (recomendado) - Blueshirt Technology
Serviço de trânsito baseado na API oficial - API GPTMeta Ajuda, alguém pode dar algumas dicas sobre como fazer perguntas no GPT? - Conhecimento
Loja digital de bens virtuais globais - Global SmarTone (Feng Ling Ge) Quão poderosa é a funcionalidade Claude airtfacts que o GPT instantaneamente não cheira bem? -BeepBeep

espaço publicitário

Serviço de agente de trânsito baseado em APIs oficiais

Nesta era de abertura e partilha, o OpenAI lidera uma revolução na inteligência artificial. Agora, anunciamos ao mundo que suportámos totalmente todos os modelos da OpenAI, por exemplo, suportando GPT-4-ALL, GPT-4-multimodal, GPT-4-gizmo-*, etc., bem como uma variedade de grandes modelos desenvolvidos internamente. O mais interessante é que apresentámos ao mundo o mais poderoso e influente GPT-4o!

Navegação no sítio

fig. início
Atracagem de terceiros
consolas
Instruções de utilização
Monitorização em linha

Contactar-nos

公众号二维码

número público

企业合作二维码

Cooperação Wechat

Direitos de autor © 2021-2024 Todos os direitos reservados 2024 | GPTMeta API