GPT-5.4 da OpenAI chega e supera humanos em tarefas profissionais

admin

7 Mar, 2026

A OpenAI lançou nesta quinta-feira (5), o GPT-5.4, seu novo modelo de inteligência artificial descrito como “o mais capaz e eficiente para trabalho profissional“. A empresa disponibilizou o modelo no ChatGPT, na API e no Codex simultaneamente, em resposta à crescente demanda por soluções de IA voltadas a tarefas corporativas de alta complexidade. Além da versão padrão, a OpenAI também liberou o GPT-5.4 Thinking, focado em raciocínio, e o GPT-5.4 Pro, voltado ao máximo desempenho.Leia mais:Computer: Perplexity anuncia agente de IA que funciona com outros agentesGoogle quer integrar o Nano Banana ao Google MapsMonge-robô com IA orienta fiéis em templos no JapãoVERSÕES E DIFERENCIAISO GPT-5.4 está disponível em três versões, cada uma com foco distinto:GPT-5.4 (padrão): disponível no ChatGPT, na API e no Codex; incorpora capacidades de codificação do GPT-5.3-Codex e melhora o desempenho em planilhas, apresentações e documentosGPT-5.4 Thinking: exibe um plano inicial de raciocínio antes de concluir a resposta, permitindo que o usuário ajuste o caminho da tarefa enquanto o modelo ainda trabalha; também melhora a pesquisa aprofundada na web, especialmente em consultas muito específicasGPT-5.4 Pro: otimizado para máximo desempenho em tarefas complexas; disponível no ChatGPT e na API para quem precisa do melhor resultado possívelUSO DE COMPUTADOR E APINa API e no Codex, o GPT-5.4 se destaca por ser o primeiro modelo de uso geral da OpenAI com capacidade nativa de uso de computador. Isso significa que agentes de IA podem operar sistemas operacionais, navegar em navegadores e executar tarefas em aplicativos como Gmail e Excel sem necessidade de integrações adicionais.OpenAI contrata desenvolvedor por trás do sucesso do agente OpenClawOutros destaques técnicos para desenvolvedores incluem:Janela de contexto de até 1 milhão de tokens — a maior já oferecida pela OpenAI na APINovo sistema Tool Search, que permite ao agente buscar definições de ferramentas apenas quando necessário, reduzindo consumo de tokens em sistemas com muitas integraçõesEficiência de tokens significativamente superior ao GPT-5.2, resultando em respostas mais rápidas e custos menoresA OpenAI também avança em outras frentes de hardware, mostrando que a estratégia da empresa vai além dos modelos de linguagem.BENCHMARKS E DESEMPENHOOs resultados em benchmarks mostram um salto expressivo em relação aos modelos anteriores:BenchmarkGPT-5.4GPT-5.3-CodexGPT-5.2GDPval (vitórias ou empates)83,0%70,9%70,9%SWE-Bench Pro (público)57,7%56,8%55,6%OSWorld-Verified75,0%74,0%47,3%Toolathlon54,6%51,9%46,3%BrowseComp82,7%77,3%65,8%No OSWorld-Verified, que mede o uso de computador via capturas de tela, o GPT-5.4 atingiu 75% de sucesso — superando inclusive a performance humana, fixada em 72,4%. No GDPval, que testa agentes em 44 ocupações profissionais, o modelo igualou ou superou profissionais humanos em 83% das comparações.PRECISÃO E REDUÇÃO DE ALUCINAÇÕESA OpenAI afirma que o GPT-5.4 é seu modelo mais factual até hoje. Em comparação ao GPT-5.2:Afirmações individuais são 33% menos propensas a conter errosRespostas completas têm 18% menos chance de incluir qualquer tipo de equívocoEsse avanço é resultado de um esforço contínuo da empresa para reduzir alucinações, um dos problemas mais críticos dos grandes modelos de linguagem. A OpenAI também introduziu uma nova avaliação de segurança para testar a cadeia de raciocínio do modelo, concluindo que o GPT-5.4 Thinking tem menor propensão a ocultar ou distorcer seu processo de pensamento.AVALIAÇÕES DO MERCADOProfissionais das áreas jurídica e financeira já testaram o modelo e relataram resultados positivos.“GPT-5.4 é o melhor modelo que já testamos. Ele lidera nosso benchmark APEX-Agents, que mede desempenho para trabalho em serviços profissionais. Se destaca na criação de entregas de longo prazo, como apresentações, modelos financeiros e análises jurídicas, entregando alto desempenho com velocidade maior e custo menor do que modelos concorrentes de ponta,” disse Brendan Foody, CEO da Mercor.Google anuncia Gemini 3.1 Pro para resolução de problemas complexosNiko Grupen, chefe de pesquisa aplicada da Harvey, também destacou os resultados na área jurídica: “GPT-5.4 estabelece um novo padrão para trabalho jurídico com documentos extensos. Em nosso benchmark BigLaw Bench, ele pontuou 91%. É atualmente melhor em estruturar análises transacionais complexas, manter precisão em contratos longos e entregar o nível de detalhe que os profissionais do direito exigem.”DISPONIBILIDADEChatGPT: rollout gradual para planos Plus, Team, Pro e EnterpriseAPI: já disponível para desenvolvedores, com suporte a 1 milhão de tokens de contexto e Tool SearchCodex: disponível simultaneamente ao lançamentoEnterprise: clientes também têm acesso ao novo add-in do ChatGPT para Excel, lançado na mesma dataConteúdo Relacionado ANÁLISEDJI Mavic 4 Pro – Análise / review do melhor drone do mundoFonte: OpenAI