El modelo GPT-5.1-Codex-Max es la nueva propuesta de OpenAI para tareas más complejas de programación. En este artículo explicamos qué es, en qué se diferencia de versiones anteriores, cómo rinde en escenarios reales, su eficiencia en coste y tokens, y su disponibilidad. Si te interesa entender cómo puede encajar en un flujo de trabajo técnico, continúa leyendo.
Qué es GPT-5.1-Codex-Max y para qué se utiliza en desarrollo
GPT-5.1-Codex-Max es un modelo de codificación diseñado para ingeniería de software, matemáticas, investigación y otras tareas técnicas. Está entrenado para trabajar con sesiones prolongadas mediante un proceso llamado compaction, que le permite gestionar múltiples ventanas de contexto de forma coherente incluso cuando el número total de tokens supera el tamaño habitual de una sesión.
También incorpora mejoras para entornos reales de trabajo: creación de pull requests, revisión de código, desarrollo de frontend y asistencia técnica. Además, ha sido preparado para funcionar de forma nativa en sistemas Windows, lo que amplía su alcance en entornos de desarrollo profesionales.
Diferencias entre GPT-5.1-Codex-Max y otros modelos de codificación
El modelo introduce mejoras en eficiencia, gestión de contexto, soporte técnico y rendimiento en pruebas de ingeniería. Estas diferencias lo posicionan como una opción enfocada a tareas de desarrollo más prolongadas y exigentes.
|
Característica |
Mejora en GPT-5.1-Codex-Max |
|
Eficiencia de tokens |
Reduce cerca de un 30 % los “thinking tokens” necesarios en varias evaluaciones internas. |
|
Compatibilidad técnica |
Es el primer modelo de la serie preparado para trabajar en entornos Windows. |
|
Trabajo a largo plazo |
Puede sostener sesiones de trabajo largas gracias a compaction, incluso durante más de 24 horas en pruebas internas. |
Cómo rinde GPT-5.1-Codex-Max en tareas reales de programación
Los datos publicados por la compañía muestran mejoras claras respecto a la generación anterior (Codex). En pruebas internas de ingeniería de software, el modelo obtiene mejores resultados en tareas de razonamiento y codificación compleja. En concreto, en evaluaciones como “SWE-Lancer IC SWE”, aumenta su precisión de forma notable respecto al modelo anterior, lo que indica un mayor nivel de acierto en tareas reales relacionadas con ingeniería.
El modelo también ha demostrado capacidad para completar proyectos complejos, como aplicaciones de navegador con gráficos, métricas, funciones de aprendizaje por refuerzo o visualización de redes neuronales, generando miles de líneas de código y gestionando múltiples herramientas durante el proceso.
Gracias al mecanismo de compaction, cuando la sesión está cerca del límite de contexto, el modelo organiza su historial para liberar espacio sin perder coherencia. Esto permite continuar trabajando sin interrupciones ni pérdida de información relevante.
Cómo afecta GPT-5.1-Codex-Max al coste y a la eficiencia del desarrollo
La eficiencia en el uso de tokens es una de las mejoras más visibles. Con niveles de razonamiento medios, el modelo consigue mejor rendimiento que su predecesor consumiendo menos tokens. Este tipo de optimización puede traducirse en costes más bajos para equipos que trabajan con cargas intensivas de código o con modelos que procesan gran cantidad de información.
Además, el hecho de que pueda manejar sesiones largas reduce la necesidad de reinicios o fragmentación del flujo de trabajo, lo que contribuye a una mejora en productividad y continuidad durante tareas complejas.
Disponibilidad de GPT-5.1-Codex-Max y requisitos
El modelo ya se encuentra disponible para usuarios de la línea Codex en CLI, extensiones de IDE y servicios en la nube dentro de ChatGPT Plus, Pro, Business, Edu y Enterprise. La API se incorporará más adelante.
Para aprovechar sus capacidades es recomendable trabajar en entornos en los que sea útil mantener sesiones largas, gestionar grandes volúmenes de tokens o abordar proyectos que requieran continuidad.
La compañía ha anunciado que este modelo pasará a ser la opción por defecto en los servicios de Codex para tareas de programación.


