OpenAI Nova geração de revolução na programação: Codex Intelligence Body Analysis

A OpenAI lançou recentemente a muito aguardada inteligência de programação Codex, uma poderosa ferramenta integrada no ChatGPT que entrou oficialmente na fase de pré-visualização de investigação. Sendo um sistema de assistência à engenharia de software baseado na nuvem, espera-se que o Codex revolucione a forma como os programadores trabalham, melhore a eficiência da programação e simplifique o processamento de tarefas complexas. Neste artigo, iremos apresentar uma análise exaustiva das caraterísticas, dos princípios de funcionamento e das aplicações práticas desta tecnologia revolucionária.

Entrada do sítio Web oficial:https://openai.com/index/openai-codex/

Codex Intelligent Bodies: O início de uma nova era de programação

A OpenAI lançou a inteligência de programação Codex em maio de 2025, após a adição da capacidade de ligação aos repositórios GitHub no ChatGPT. Trata-se de uma inteligência de engenharia de software baseada na nuvem capaz de realizar uma variedade de tarefas de programação, incluindo:

  • Escrever novos módulos funcionais
  • Corrigir erros e vulnerabilidades do código
  • Execução da verificação de testes
  • Apresentação de alterações de código
  • Gerir e executar várias tarefas de codificação em simultâneo

Ao contrário dos assistentes de programação tradicionais, o Codex baseia-se no modelo codex-1 (que é uma versão especializada do modelo o3 da OpenAI), optimizado especificamente para a engenharia de software, e é treinado através da aprendizagem por reforço num ambiente de programação real, de modo a que o código que gera reflicta os estilos de codificação humanos, siga as instruções à letra e possa ser testado repetidamente até atingir os resultados desejados.

Como funciona o Codex e as suas principais caraterísticas

fluxo de trabalho

O fluxo de trabalho do Codex foi concebido para ser simples e intuitivo:

  1. Acesso do utilizador ao Codex através da barra lateral do ChatGPT
  2. Introduza os seus requisitos e clique no botão "Código" para atribuir uma tarefa ou clique no botão "P&R" para fazer uma pergunta relacionada com o código.
  3. O Codex executa tarefas num ambiente de nuvem seguro e isolado que é pré-carregado com a base de código do utilizador
  4. Os utilizadores podem acompanhar o progresso das tarefas em tempo real
  5. Após a conclusão da tarefa, o Codex confirma as alterações e fornece provas detalhadas da implementação, incluindo registos de terminais e resultados de testes
  6. Os utilizadores podem rever os resultados, solicitar mais modificações ou integrar alterações no fluxo de trabalho

Principais caraterísticas técnicas

caraterizaçãodescrições
multitarefaCapacidade para gerir simultaneamente várias tarefas de programação independentes
Executar na nuvemAs tarefas são executadas em contentores de nuvem isolados de forma segura, sem ocupar recursos locais
Integração da base de códigoSuporta a integração perfeita com repositórios GitHub, permitindo a leitura e a manipulação diretas do código do utilizador.
Compreensão inteligente de códigosCapacidade para compreender estruturas de código complexas, identificar potenciais problemas e apresentar soluções
cadeia de custódia completaFornecer provas verificáveis da execução das tarefas através de registos de terminais, resultados de testes, etc.
Configuração do ambienteSuporte para configurações personalizadas para adequar o ambiente às definições reais de desenvolvimento
Segurança e proteçãoO acesso à Internet é desativado durante a execução e a interação com o código explicitamente autorizado e as dependências é limitada

Vale a pena notar que o Codex suporta o seguimento do AGENTES.md Guias de documentação, semelhantes a um programador humano que lê um ficheiro README para compreender as especificações de um projeto. O Codex tem um melhor desempenho quando configurado corretamente, testado de forma fiável e claramente documentado.

Caso prático: Demonstração de competências de programação do Codex

Abaixo estão exemplos da utilização do Codex em projectos reais de código aberto, demonstrando a sua capacidade de lidar com uma variedade de tarefas de programação:

Caso 1: Correção de um problema de cálculo de CompoundModels aninhados na biblioteca astropy

Neste caso, o Codex precisava de resolver o problema de a separability_matrix do módulo Modeling no repositório astropy/astropy não estar a calcular corretamente a separabilidade dos CompoundModels aninhados.

O Codex gerou uma modificação de código muito concisa e precisa, apenas com as alterações necessárias ao núcleo do problema. Em contrapartida, o esquema de modificação do modelo o3 era mais longo e acrescentava mesmo alguns comentários desnecessários.

Caso 2: Correção de erros de calibração da janela matplotlib

Esta tarefa requer que a biblioteca matplotlib seja corrigida. mlab._spectral_helper A correção da janela está incorrecta.

O Codex também demonstra a capacidade de corrigir as coisas com precisão e simplicidade, modificando apenas as linhas de código necessárias para manter a clareza e a facilidade de manutenção.

Caso 3: Resolver o problema da expressão de duração em django

Neste caso, foi necessário corrigir um problema na estrutura do django em que as expressões que continham apenas a duração não funcionavam corretamente no SQLite e no MySQL.

O Codex não só fornece uma correção limpa, como também preenche primeiro as chamadas de dependência em falta, demonstrando a sua capacidade de compreender totalmente o contexto do código.

Caso 4: Corrigir o problema de atualização do nome da sala de chat dos membros do expensify

Este caso envolve um erro no expensify (um software de colaboração financeira centrado no chat): depois de eliminar a cache, os nomes das salas de chat dos membros não eram actualizados no LHN.

O Codex identificou o problema e forneceu uma correção precisa e eficaz, enquanto o modelo o3 fez algumas alterações ineficazes ao código.

Avaliação do desempenho e análise comparativa

pontuação de base

No benchmark SWE-Bench Verified, o Codex (codex-1) obteve resultados impressionantes:

modelaçãoPontuação SWE-bench
Codex (codex-1)72.1%
Claude 3.762.3%
o3-alto71.7%

Os testes foram realizados com um comprimento de contexto de até 192 000 fichas, utilizando uma definição média de "esforço de raciocínio", a mesma que está atualmente disponível nas versões do produto Codex.

Comparação da geração de código com o modelo o3

Exemplos do mundo real demonstram que o codex-1 gera consistentemente patches de alteração de código mais limpos e claros do que o OpenAI o3, que podem ser imediatamente revistos manualmente e integrados em fluxos de trabalho padrão. Em vários testes de bibliotecas de código aberto, o codex demonstrou maior precisão e melhor qualidade de código.

Feedback sobre a utilização efectiva

A equipa interna da OpenAI adoptou o Codex como parte das suas ferramentas de desenvolvimento diárias, principalmente para executar tarefas repetitivas e bem delimitadas, como a refacção de código, a renomeação e a escrita de testes que normalmente interrompem o fluxo de concentração de um programador.

Além disso, os primeiros testes com vários parceiros externos, incluindo a Cisco, a Temporal, a Superhuman e a Kodiak, demonstraram que o Codex acelera significativamente tarefas como o desenvolvimento de funcionalidades, a depuração de problemas, a elaboração e execução de testes e melhora a eficiência da equipa.

Disponibilidade, preços e perspectivas futuras

Disponibilidade atual

O Codex está aberto aos seguintes utilizadores:

  • Utilizadores do ChatGPT Pro ($200 por mês)
  • Utilizadores do ChatGPT Enterprise
  • Utilizadores da equipa ChatGPT

Em breve, os utilizadores do ChatGPT Plus e do Edu também poderão utilizar esta funcionalidade.

estratégia de preços

Atualmente, a OpenAI está a oferecer um período de teste gratuito em que os utilizadores podem experimentar a funcionalidade do Codex sem restrições durante as próximas semanas. Depois disso, serão introduzidos limites de velocidade e opções flexíveis de pagamento consoante o uso.

Para os programadores, o modelo codex-mini-latest está disponível na API de respostas para:

  • Token por milhão de entradas: $1.50
  • Token por milhão de saída: $6.00
  • Desfrute de um desconto na cache de alerta do 75%

O caminho a seguir

A OpenAI planeia melhorar ainda mais a interatividade e a flexibilidade do Codex:

  1. Apoio na prestação de orientação e feedback durante a execução do mandato
  2. Colaborar com a IA para implementar estratégias de programação
  3. Receber notificações proactivas de atualização do progresso
  4. Integração profunda com ferramentas de desenvolvimento populares (por exemplo, GitHub, linha de comando, rastreadores de problemas, sistemas de CI)

O lançamento do Codex Intelligent Body marca uma nova etapa na programação assistida por IA. Em vez de substituir os engenheiros, actua como um assistente fiável para tarefas entediantes e repetitivas, permitindo que os programadores se concentrem em trabalho mais criativo e estratégico. Embora ainda se encontre em fase de investigação prévia e tenha algumas limitações (por exemplo, falta de acesso à Internet, longos tempos de resposta às tarefas, etc.), o Codex demonstrou um grande potencial para remodelar a lógica subjacente ao desenvolvimento de software e tornar-se uma parte importante do futuro paradigma da programação.

Para mais produtos, consultar

Ver mais em

ShirtAI - Inteligência penetrante O Grande Modelo do AIGC: inaugurando uma era de dupla revolução na engenharia e na ciência - Penetrating Intelligence
1:1 Restauração de Claude e GPT Site oficial - AI Cloud Native Aplicação de jogos em direto Leitor de visualização de desporto HD global (recomendado) - Blueshirt Technology
Serviço de trânsito baseado na API oficial - API GPTMeta Ajuda, alguém pode dar algumas dicas sobre como fazer perguntas no GPT? - Conhecimento
Loja digital de bens virtuais globais - Global SmarTone (Feng Ling Ge) Quão poderosa é a funcionalidade Claude airtfacts que o GPT instantaneamente não cheira bem? -BeepBeep

espaço publicitário

Serviço de agente de trânsito baseado em APIs oficiais

Nesta era de abertura e partilha, o OpenAI lidera uma revolução na inteligência artificial. Agora, anunciamos ao mundo que suportámos totalmente todos os modelos da OpenAI, por exemplo, suportando GPT-4-ALL, GPT-4-multimodal, GPT-4-gizmo-*, etc., bem como uma variedade de grandes modelos desenvolvidos internamente. O mais interessante é que apresentámos ao mundo o mais poderoso e influente GPT-4o!

Navegação no sítio

fig. início
Atracagem de terceiros
consolas
Instruções de utilização
Monitorização em linha

Contactar-nos

公众号二维码

número público

企业合作二维码

Cooperação Wechat

Direitos de autor © 2021-2024 Todos os direitos reservados 2024 | GPTMeta API