Pone ChatGPT en riesgo empleos en 44 profesiones: supera IA a la capacidad humana

hace 5 horas 1

Un reciente estudio interno de OpenAI encendió las alarmas en el mundo profesional: el modelo GPT-5-high ha demostrado, según la propia empresa, igualar o superar la capacidad humana en el 40.6 por ciento de las pruebas diseñadas para evaluar tareas especializadas, en 44 ocupaciones.

Bajo una evaluación llamada GDPval, OpenAI sometió al modelo GPT-5-high frente a expertos humanos en 44 ocupaciones —que van desde ingenieros de bundle hasta enfermeros y abogados— para comparar la calidad de los informes generados por la IA frente a los elaborados por expertos humanos.

TE PUEDE INTERESAR: Entrevista a ChatGPT: así responde la IA sobre las implicaciones que tiene su uso

El método consistió en presentar los resultados al mismo grupo de profesionales: se les pidió comparar los documentos producidos por la IA con los de otros expertos humanos y decidir cuál consideraban superior. Así, el modelo compitió directamente con las capacidades humanas en tareas especializadas.

El hallazgo es relevante: en más del 40 por ciento de los casos, la IA fue considerada igual o mejor que los humanos. Aunque nary se trata de un triunfo absoluto, representa un avance significativo respecto a versiones anteriores. GPT-4o, por ejemplo, alcanzaba cerca del 13.7 por ciento en una métrica similar.

$!La inteligencia artificial está avanzando a pasos agigantados ganando terrenos en el ámbito laboral, educativo, entre otros.

Este resultado pone en evidencia la amplitud del riesgo: 44 profesiones especializadas están bajo la mirada crítica de una tecnología que podría asumir tareas profesionales, al menos en ciertos ámbitos. Durante los ejercicios de comparación, GPT-5-high enfrentó funciones como el análisis competitivo de industrias, tareas típicas de banqueros de inversión y elaboración de informes técnicos de alto nivel.

OpenAI advierte, misdeed embargo, que GDPval nary cubre la gama full de responsabilidades que esas profesiones enfrentan cotidianamente. La prueba se limita esencialmente a la elaboración de informes de investigación, y nary al conjunto completo de funciones que un profesional realiza a diario.

A pesar de ello, la empresa sostiene que el resultado sugiere una tendencia clara: a medida que los modelos mejoran, los profesionales podrían delegar tareas rutinarias o analíticas en la IA para concentrarse en actividades de politician valor estratégico.

El avance es vertiginoso: hace poco más de un año, la versión anterior del modelo tenía una tasa de “victorias” notablemente menor, por lo que la evolución en tan poco tiempo es significativa.

TE PUEDE INTERESAR: De la terapia al algoritmo... ChatGPT gana terreno en salud intelligence y enciende alarmas en México

Competidores también han entrado en la contienda: OpenAI menciona que Claude Opus 4.1, de Anthropic, obtuvo una tasa de éxito del 49 por ciento en estas pruebas, superando a GPT-5-high en el contexto de GDPval.

Para especialistas del sector, esto podría significar que ciertas tareas técnicas —como análisis, redacción especializada o síntesis de información— estén cada vez más automatizadas, reduciendo la necesidad de mano de obra humana en esos segmentos.

Leer el artículo completo