OpenAI ha anunciado recientemente Operator, un agente de inteligencia artificial que promete facilitar tareas digitales de una forma novedosa. Basado en un modelo llamado CUA (Computer-Using Agent), Operator es capaz de interactuar con la web y diversas interfaces gráficas como si fuera un humano. Pero, ¿qué lo hace relevante y qué se puede esperar de este avance? Aquí te contamos los detalles.
¿Qué es Operator, lo nuevo de OpenAI?
Operator es una vista previa de investigación que busca demostrar cómo la inteligencia artificial puede llevar a cabo tareas en entornos digitales sin necesidad de usar APIs específicas. Esto se logra gracias al modelo CUA, que combina capacidades avanzadas de visión y razonamiento para interactuar con botones, menús y otros elementos gráficos de las aplicaciones, tal como lo haría una persona.
La clave detrás de Operator radica en su capacidad para interpretar pantallas, dividir tareas complejas en pasos más simples y adaptarse a situaciones inesperadas. Todo esto abre la puerta a nuevas aplicaciones que hasta ahora no eran posibles con otros sistemas de inteligencia artificial.
¿Qué puede hacer Operator por mí?
Aunque se encuentra en una etapa inicial, Operator tiene el potencial de realizar una variedad de tareas digitales. Algunas de las funciones que ya se han probado incluyen:
- Navegar por sitios web para buscar información específica.
- Rellenar formularios y realizar operaciones en aplicaciones sin APIs especializadas.
- Gestionar tareas que implican múltiples pasos, como organizar listas, buscar ofertas o realizar búsquedas personalizadas.
Por ejemplo, en pruebas realizadas, Operator ha sido capaz de buscar casas en plataformas inmobiliarias, crear listas de reproducción en Spotify o realizar compras en línea. Sin embargo, no siempre tiene un desempeño perfecto y depende del tipo de tarea o sitio web.
¿Cómo funciona Operator?
El modelo CUA que impulsa a Operator combina visión por computadora y razonamiento avanzado. Su proceso se divide en tres fases principales:
- Percepción: el sistema analiza lo que ocurre en la pantalla utilizando capturas visuales del entorno.
- Razonamiento: con base en las imágenes y el estado actual, el modelo decide qué pasos seguir mediante un razonamiento adaptativo.
- Acción: emula interacciones humanas con teclado y ratón virtuales, como clics, desplazamientos o escritura.
Además, Operator puede autocorregirse y ajustar su enfoque si algo no sale como se esperaba, lo que lo hace especialmente útil para tareas complejas.
Casos de uso de Operator, el agente de IA
Operator se ha diseñado para abordar una amplia gama de tareas digitales. Algunos de los casos de uso probados incluyen:
- E-commerce: buscar productos específicos, comparar precios y comprobar características como la disponibilidad de envíos.
- Automatización de tareas repetitivas: crear listas, gestionar inventarios o completar formularios extensos.
- Navegación avanzada: buscar información detallada en diferentes sitios web y recopilarla de forma estructurada.
Por ejemplo, en evaluaciones internas, Operator logró una tasa de éxito del 58,1 % en tareas basadas en la web y del 87 % en entornos más controlados.
¿Cuándo estará disponible? ¿Es gratis Operator?

Operator ya está disponible en una vista previa de investigación en la plataforma operator.chatgpt.com para usuarios de ChatGPT Pro de Estados Unidos. Esto significa que, por ahora, el acceso es limitado a un único país y requiere una suscripción elevada.
Este periodo de prueba permitirá a OpenAI recopilar feedback para continuar mejorando las capacidades de Operator y abordar cualquier desafío técnico o de seguridad.
Seguridad y limitaciones de Operator
OpenAI ha implementado varias medidas de seguridad para evitar posibles usos indebidos de Operator. Por ejemplo:
- Moderación en tiempo real: las tareas son revisadas automáticamente para garantizar el cumplimiento de políticas de uso.
- Confirmaciones del usuario: antes de realizar acciones sensibles, Operator solicita aprobación.
- Protección contra errores: Ee sistema limita su uso en tareas de alto riesgo, como transacciones bancarias.
¿Un paso más cerca de los agentes IA?
Operator representa un paso importante hacia el desarrollo de agentes digitales más autónomos y versátiles. Si bien todavía tiene limitaciones, abre la puerta a nuevas posibilidades en la interacción con herramientas digitales. A medida que avance su desarrollo, será interesante observar cómo evoluciona y cómo esta tecnología puede integrarse en el día a día de los usuarios. ¿Crees que este tipo de agentes cambiará nuestra forma de trabajar con la tecnología? ¡El futuro nos lo dirá!