Montan una empresa con empleados creados por IA y el resultado dice mucho sobre el futuro del trabajo a los investigadores
Ningún empleado virtual logró resolver ni la mitad de sus tareas asignadas.

Investigadores de la Universidad Carnegie Mellon han montado una empresa ficticia en la que los empleados no son humanos, sino agentes virtuales dotados de inteligencia artificial. El objetivo era claro: poner a prueba si estas herramientas digitales podían desempeñar puestos laborales de manera autónoma. Sin embargo, los resultados del experimento no han dado pie con bola y han sido más bien decepcionantes, según publica Futura Science sobre el estudio publicado como preimpresión en la plataforma Arxiv.
Para realizar este ensayo se han utilizado agentes virtuales basados en diversas tecnologías punteras como Claude de Anthropic, GPT-4o de OpenAI, Gemini de Google, Nova de Amazon, Llama de Meta y Qwen de Alibaba. Estos empleados digitales han asumido roles de analista financiero, jefe de proyecto o ingeniero de software, simulando así un entorno laboral realista que permita valorar su capacidad de adaptación y resolución autónoma de problemas.
Las tareas asignadas fueron variadas, desde analizar bases de datos hasta realizar visitas virtuales para elegir nuevos locales de trabajo. Pero la realidad se ha impuesto rápidamente: más del 75% de estas tareas han quedado sin completar. Claude 3.5 Sonnet, la inteligencia artificial que mejores resultados obtuvo, apenas logró cumplir con éxito el 24% de sus encargos. Incluso sumando aquellas tareas parcialmente resueltas, su efectividad llegó solo al 34,4%. Por detrás, y aún más lejos de lo esperado, Gemini 2.0 Flash completó únicamente el 11,4% de las funciones asignadas. Su ventaja, eso sí, fue económica: costó tan solo 0,79 dólares frente a los 6,34 de Claude.
Entre los principales fallos detectados, destaca especialmente la incapacidad de estos trabajadores digitales para interpretar instrucciones implícitas. Por ejemplo, cuando se les pidió entregar documentos en formato «.docx», no fueron capaces de entender que se trataba de archivos de Microsoft Word. Tampoco demostraron habilidad suficiente para navegar correctamente por páginas web con pop-ups o ventanas emergentes.
Además, otro problema significativo del experimento fue la falta de habilidades sociales básicas. Cuando los empleados virtuales tuvieron que interactuar con compañeros simulados en otras plataformas, como el departamento de recursos humanos, la comunicación resultó caótica o directamente inexistente. También se observó que, al encontrar dificultades, los agentes optaron frecuentemente por atajos fáciles, saltándose pasos esenciales y considerando erróneamente que habían completado con éxito la tarea asignada.
Este experimento pone sobre la mesa que, pese al auge imparable de la inteligencia artificial, su implementación total en el mercado laboral aún está lejos de producirse. Mientras algunas empresas en España ya apuestan fuerte por la automatización, este fiasco indica que los empleos humanos tienen aún más recorrido y seguridad de la que algunos anticipaban.