GPT-5.4 da OpenAI chega e supera humanos em tarefas profissionais

admin
7 Mar, 2026
A OpenAI lançou nesta quinta-feira (5), o GPT-5.4, seu novo modelo de inteligência artificial descrito como “o mais capaz e eficiente para trabalho profissional“. A empresa disponibilizou o modelo no ChatGPT, na API e no Codex simultaneamente, em resposta à crescente demanda por soluções de IA voltadas a tarefas corporativas de alta complexidade. Além da versão padrão, a OpenAI também liberou o GPT-5.4 Thinking, focado em raciocínio, e o GPT-5.4 Pro, voltado ao máximo desempenho.Leia mais:Computer: Perplexity anuncia agente de IA que funciona com outros agentesGoogle quer integrar o Nano Banana ao Google MapsMonge-robô com IA orienta fiéis em templos no JapãoVERSÕES E DIFERENCIAISO GPT-5.4 está disponível em três versões, cada uma com foco distinto:GPT-5.4 (padrão): disponível no ChatGPT, na API e no Codex; incorpora capacidades de codificação do GPT-5.3-Codex e melhora o desempenho em planilhas, apresentações e documentosGPT-5.4 Thinking: exibe um plano inicial de raciocínio antes de concluir a resposta, permitindo que o usuário ajuste o caminho da tarefa enquanto o modelo ainda trabalha; também melhora a pesquisa aprofundada na web, especialmente em consultas muito específicasGPT-5.4 Pro: otimizado para máximo desempenho em tarefas complexas; disponível no ChatGPT e na API para quem precisa do melhor resultado possívelUSO DE COMPUTADOR E APINa API e no Codex, o GPT-5.4 se destaca por ser o primeiro modelo de uso geral da OpenAI com capacidade nativa de uso de computador. Isso significa que agentes de IA podem operar sistemas operacionais, navegar em navegadores e executar tarefas em aplicativos como Gmail e Excel sem necessidade de integrações adicionais.OpenAI contrata desenvolvedor por trás do sucesso do agente OpenClawOutros destaques técnicos para desenvolvedores incluem:Janela de contexto de até 1 milhão de tokens — a maior já oferecida pela OpenAI na APINovo sistema Tool Search, que permite ao agente buscar definições de ferramentas apenas quando necessário, reduzindo consumo de tokens em sistemas com muitas integraçõesEficiência de tokens significativamente superior ao GPT-5.2, resultando em respostas mais rápidas e custos menoresA OpenAI também avança em outras frentes de hardware, mostrando que a estratégia da empresa vai além dos modelos de linguagem.BENCHMARKS E DESEMPENHOOs resultados em benchmarks mostram um salto expressivo em relação aos modelos anteriores:BenchmarkGPT-5.4GPT-5.3-CodexGPT-5.2GDPval (vitórias ou empates)83,0%70,9%70,9%SWE-Bench Pro (público)57,7%56,8%55,6%OSWorld-Verified75,0%74,0%47,3%Toolathlon54,6%51,9%46,3%BrowseComp82,7%77,3%65,8%No OSWorld-Verified, que mede o uso de computador via capturas de tela, o GPT-5.4 atingiu 75% de sucesso — superando inclusive a performance humana, fixada em 72,4%. No GDPval, que testa agentes em 44 ocupações profissionais, o modelo igualou ou superou profissionais humanos em 83% das comparações.PRECISÃO E REDUÇÃO DE ALUCINAÇÕESA OpenAI afirma que o GPT-5.4 é seu modelo mais factual até hoje. Em comparação ao GPT-5.2:Afirmações individuais são 33% menos propensas a conter errosRespostas completas têm 18% menos chance de incluir qualquer tipo de equívocoEsse avanço é resultado de um esforço contínuo da empresa para reduzir alucinações, um dos problemas mais críticos dos grandes modelos de linguagem. A OpenAI também introduziu uma nova avaliação de segurança para testar a cadeia de raciocínio do modelo, concluindo que o GPT-5.4 Thinking tem menor propensão a ocultar ou distorcer seu processo de pensamento.AVALIAÇÕES DO MERCADOProfissionais das áreas jurídica e financeira já testaram o modelo e relataram resultados positivos.“GPT-5.4 é o melhor modelo que já testamos. Ele lidera nosso benchmark APEX-Agents, que mede desempenho para trabalho em serviços profissionais. Se destaca na criação de entregas de longo prazo, como apresentações, modelos financeiros e análises jurídicas, entregando alto desempenho com velocidade maior e custo menor do que modelos concorrentes de ponta,” disse Brendan Foody, CEO da Mercor.Google anuncia Gemini 3.1 Pro para resolução de problemas complexosNiko Grupen, chefe de pesquisa aplicada da Harvey, também destacou os resultados na área jurídica: “GPT-5.4 estabelece um novo padrão para trabalho jurídico com documentos extensos. Em nosso benchmark BigLaw Bench, ele pontuou 91%. É atualmente melhor em estruturar análises transacionais complexas, manter precisão em contratos longos e entregar o nível de detalhe que os profissionais do direito exigem.”DISPONIBILIDADEChatGPT: rollout gradual para planos Plus, Team, Pro e EnterpriseAPI: já disponível para desenvolvedores, com suporte a 1 milhão de tokens de contexto e Tool SearchCodex: disponível simultaneamente ao lançamentoEnterprise: clientes também têm acesso ao novo add-in do ChatGPT para Excel, lançado na mesma dataConteúdo Relacionado ANÁLISEDJI Mavic 4 Pro – Análise / review do melhor drone do mundoFonte: OpenAI