A 10 de julho, hora de Pequim, após uma hora de espera pela atenção do mundo, Musk revelou finalmente o mistério da mais recente obra-prima da xAI - o Grok 4, a que Musk chamou "a IA mais inteligente do mundo". Este modelo, a que Musk chamou "a IA mais inteligente do mundo", estabeleceu novos recordes nos principais testes de referência assim que foi lançado e tornou-se o primeiro modelo de IA a ultrapassar a taxa de precisão de 50% no "Human Last Exam" (HLE).

Escala aritmética: entradas de formação sem precedentes
A escala do treino do Grok 4 reflecte o enorme investimento da xAI em infra-estruturas de IA, com um nível sem precedentes de atribuição de potência de computação:
Configuração da infraestrutura
Configuração do hardware | Especificação | Atribuição da utilização |
---|---|---|
Clusters de pré-treino | 100.000 GPUs H100 | Formação de modelos básicos |
Grupo de aprendizagem reforçada | 200.000 folhas de mistura H100/A100 | Afinação de RL e otimização da inferência |
potência computacional total (TCP) | Centro de Supercomputação Colossus | Formação em IA para todo o processo |
rácio de duração da formação | 100 vezes melhor do que Grok 2 | Iteração de aprendizagem profunda |
Rácio de cálculo RL | 10 vezes melhor que o Grok 3 | Especializado em aprendizagem intensiva |
Musk revelou que a xAI investe quase tanta aritmética na aprendizagem por reforço como na pré-treino, uma abordagem de treino orientada por um "motor duplo" que é extremamente rara na indústria. A equipa treinou o modelo para pensar, raciocinar e auto-corrigir-se a partir dos primeiros princípios, que é a fonte principal da capacidade de raciocínio da série Grok.

Evolução da arquitetura de formação
O paradigma de formação da família Grok sofreu uma evolução significativa:
versão do modelo | Principais paradigmas tecnológicos | Atribuição de recursos de computação | Descobertas fundamentais |
---|---|---|---|
Grok 2 | Previsão da próxima ficha | A pré-treino básico é o principal objetivo | Aumentar a escala |
Grok 3 | Pré-treino + RL preliminar | Aumento de 10 vezes na aritmética pré-treino | Introdução das capacidades de raciocínio |
Grok 4 | Fusão de ferramentas nativas + RL em grande escala | Aritmética RL aumentada em mais 10 vezes | Utilização de ferramentas e multi-inteligência |

Arquitetura da tecnologia de base: conceção inovadora para integração nativa
Mecanismo de formação para a integração de ferramentas
A maior inovação tecnológica do Grok 4 é a integração dos recursos de uso da ferramenta diretamente no processo de treinamento, em vez da abordagem tradicional de pós-integração:
Caraterísticas técnicas | Programas tradicionais | Programa Grok 4 | melhoria do desempenho |
---|---|---|---|
Método de invocação da ferramenta | Integração pós-API | Integração da formação nativa | Aumentar a eficiência em 3-5 vezes |
curva de aprendizagem | Período de adaptação acentuada | crescimento suave | Melhor coerência |
escalabilidade | limitado pela interface | integração perfeita | Suporte para cadeias de ferramentas complexas |
coerência de raciocínio | facilmente criticável | Otimização de ponta a ponta | Redução da taxa de erro 40% |
Esse design permite que o Grok 4 aprenda quando, como e por que usar ferramentas específicas durante o treinamento, em vez de simplesmente chamar APIs externas.
Sistema de Colaboração Multi-Inteligência
O Grok 4 Heavy utiliza um modo de funcionamento paralelo multi-inteligência com as seguintes especificações técnicas:
Parâmetros de colaboração | especificações técnicas | Mecanismos de funcionamento |
---|---|---|
Número de inteligências paralelas | Até 32 | Tratamento simultâneo da mesma questão |
Estratégias de ramificação para raciocínio | árvore de pesquisa profunda | Cada ramo é explorado de forma independente |
Mecanismos de validação colaborativa | Algoritmos de validação cruzada | Controlo inter-inteligências |
seleção de soluções óptimas | Fusão de aprendizagem integrada | Geração de respostas globais óptimas |
Cálculo das extensões durante os ensaios | Ajustável de 1× a 32× | Ajusta-se dinamicamente à complexidade da tarefa |
Esta "equipa de doutorandos a trabalhar em grupo" aumentou a precisão de 40% para mais de 50% para inteligências individuais.

Parâmetros de desempenho do modelo
Indicadores principais | Especificações do Grok 4 | Comparação entre sectores |
---|---|---|
Comprimento do contexto | 256K fichas | Normas de aplicações empresariais |
Número da versão da API | grok-4-0709 | Última versão estável |
rapidez de raciocínio | 75 tokens/segundo | Para além de Claude 4 Opus (66 fichas/segundo) |
Otimização da latência | Redução para metade de ponta a ponta | Interação por voz em tempo real |
processamento simultâneo | Suporte para multi-utilizadores com elevada concorrência | Pronto para a comercialização |
era da modelação | Infraestrutura de 7ª geração | A mais recente pilha de tecnologia da xAI |


Avaliação comparativa do desempenho: Liderar a inteligência em toda a linha
Aptidões académicas e de raciocínio
O Grok 4 comprova o seu "nível pós-doutoral" de inteligência através de um bom desempenho nos testes mais prestigiados:
Categoria de teste | Objectivos de referência específicos | Pontuação do Grok 4 | Grok 4 Pesado | Comparação dos níveis de doutoramento humano |
---|---|---|---|---|
tema geral | HLE (Human Legacy Examination) | 38.6% | 44.4% | Para além da maioria dos estudantes de doutoramento |
concurso de matemática | AIME25 | 100% | 100% | nível de nota máxima |
Equipa de Matemática | HMMT25 | 96.7% | 96.7% | Nível de competição superior |
Perguntas e respostas para estudantes de pós-graduação | GPQA | 88.9% | 88.9% | Nível de entrada no doutoramento |
Olimpíada de Matemática | USAMO25 | 61.9% | 61.9% | Nível de competição internacional |
concurso de programação | LCB (janeiro-maio) | 79.4% | 79.4% | Nível de programador profissional |

Avaliação das competências essenciais da AGI
O Grok 4 também se destacou no teste chave de IA geral:
Itens do teste AGI | Desempenho do Grok 4 | significado técnico | Comparação com os concorrentes |
---|---|---|---|
ARC-AGI-2 | 15.9% | Primeiro modelo comercial a ultrapassar os 10% | 12 vezes superior ao DeepSeek R1 |
ARC-AGI-1 | 66.7% | Capacidade de generalizar a partir de padrões conhecidos | Ultrapassa o GPT-4 em quase 6 pontos percentuais |
rácio custo-eficácia | ótimo | Mais inteligente por unidade de dólar | Relação preço/desempenho líder na indústria |

Cenários de teste especiais
Numa série de cenários de teste únicos, o Grok 4 demonstrou a capacidade de superar a IA tradicional:
cenário de teste | expressão concreta | Implicações técnicas |
---|---|---|
Teste de negócio de bancada de venda automática | Património líquido duas vezes superior ao do segundo classificado | Capacidade de decisão empresarial a longo prazo |
Descoberta de medicamentos RKG | O único modelo a quebrar o 10% | raciocínio biomédico |
Modelação física complexa | Simulação bem sucedida de colisões de buracos negros | Conhecimentos avançados de computação científica |

Estratégia de preços e de comercialização
A xAI tem uma estratégia clara de posicionamento de topo de gama para o Grok 4:
nível de serviço | Preços mensais | Preço da taxa anual | Diferenças funcionais fundamentais |
---|---|---|---|
SuperGrok | $30 | $300 | Carroçaria Inteligente Única Edição Standard |
SuperGrok Pesado | $300 | $3,000 | Edição de Colaboração Multi-Inteligência |
Esta estratégia de preços posiciona o Grok 4 como um serviço de IA topo de gama para empresas e utilizadores profissionais, com uma taxa anual de até CNY 21.500 para a versão Heavy.

Perspectivas de aplicação e integração na indústria
O Grok 4 será rapidamente integrado no ecossistema industrial de Musk: o assistente de voz foi integrado no mais recente firmware da Tesla e o robô Optimus será equipado com o Grok como o seu cérebro de IA. A xAI planeia lançar modelos de programação dedicados, agentes multimodais e modelos de geração de vídeo em grande escala, um após o outro, nos próximos meses, para construir uma matriz completa de produtos de IA.
O Grok 4 estabeleceu uma posição de liderança na competição de IA com a vantagem aritmética de 200.000 clusters de GPU e a inovação tecnológica da fusão de ferramentas nativas. O seu desempenho esmagador em benchmarks, especialmente em tarefas complexas que requerem raciocínio profundo, marca um passo significativo em direção à "super inteligência humana". Embora o seu preço elevado limite a sua popularidade, o Grok 4 oferece a opção mais poderosa do mercado atual para utilizadores profissionais que procuram o máximo em poder de IA.

Se pretender utilizar a conta exclusiva paga oficial GPT Plus, Claude Pro, Grok Super, pode contactar a nossa equipa de profissionais (wx: f15303420735) se não souber como efetuar o carregamento.