OpenAI divulga lista de tarefas que ChatGPT já seria capaz de substituir

ChatGPT

A OpenAI apresentou nesta semana uma nova avaliação de desempenho de seus modelos de inteligência artificial, chamada GDPval, com o objetivo de medir como os sistemas da empresa se saem em tarefas economicamente relevantes do mundo real em 44 ocupações diferentes.

Segundo a empresa, o estudo busca trazer dados concretos sobre o potencial do ChatGPT e de outros modelos, ao invés de depender de especulações sobre o impacto da IA na sociedade. “Avaliações como a GDPval ajudam a fundamentar conversas sobre melhorias futuras em IA com base em evidências, e permitem acompanhar a evolução dos modelos ao longo do tempo”, escreveu a OpenAI em seu blog oficial.

De acordo com o Futurism.com, entre as profissões avaliadas estão corretores de imóveis, assistentes sociais, engenheiros industriais, desenvolvedores de software, advogados, enfermeiros, atendentes de SAC, farmacêuticos, detetives particulares e consultores financeiros. As tarefas incluem desde criar um “mapa de concorrência para entregas de última milha” para um analista financeiro, até avaliar imagens de lesões de pele para enfermeiros ou produzir material de divulgação para corretores.

Nos resultados preliminares, a OpenAI afirmou que os melhores modelos de ponta já se aproximam da qualidade do trabalho realizado por especialistas do setor. O estudo também apontou que o modelo Claude Opus 4.1, da concorrente Anthropic, foi o de melhor desempenho em 220 tarefas avaliadas, seguido pelo GPT-5, que se destacou pela precisão. Uma versão mais avançada, o GPT-5-high, alcançou resultados iguais ou superiores aos entregáveis de especialistas em mais de 40% das tarefas, enquanto o GPT-4o apresentou desempenho de apenas 13,7%.

Apesar das afirmações sobre produtividade, a OpenAI evita afirmar que a IA substituirá empregos humanos por completo. A empresa defende que a tecnologia deve “auxiliar as pessoas em suas tarefas diárias”, sem sugerir que trabalhadores serão substituídos em massa.

Especialistas, no entanto, alertam que é preciso interpretar os dados com cautela. Problemas como “alucinações” de IA, erros em tarefas mais complexas e necessidade de supervisão humana mostram que modelos como o ChatGPT ainda exigem intervenção profissional em muitas situações. A própria OpenAI reconhece que “tarefas do mundo real raramente são claramente definidas com prompts e arquivos de referência”, e que “a maioria dos trabalhos envolve mais do que apenas uma coleção de tarefas bem especificadas”.

O levantamento evidencia que, embora a IA possa executar tarefas repetitivas e bem definidas de forma mais rápida e econômica, grande parte das funções humanas ainda depende de julgamento, experiência e adaptação — capacidades que a tecnologia ainda não consegue substituir integralmente.

Compartilhe: