Publicado por: 13punto8 | Temas: Internet, Noticia,
OpenAI anunció el lunes el lanzamiento de una nueva versión de GPT-5 para su agente de codificación de IA, Codex. La compañía afirma que su nuevo modelo, llamado GPT-5-Codex, utiliza su tiempo de reflexión de forma más dinámica que los modelos anteriores y puede dedicar desde unos pocos segundos hasta siete horas a una tarea de codificación. Como resultado, ofrece un mejor rendimiento en las pruebas de referencia de codificación de agentes.
El nuevo modelo ya se está implementando en los productos Codex (a los que se puede acceder a través de una terminal, IDE, GitHub o ChatGPT) para todos los usuarios de ChatGPT Plus, Pro, Business, Edu y Enterprise. OpenAI afirma que planea poner el modelo a disposición de los clientes de API en el futuro.
La actualización forma parte del esfuerzo de OpenAI por hacer que Codex sea más competitivo frente a otros productos de codificación de IA, como Claude Code, Cursor de Anysphere o GitHub Copilot de Microsoft. El mercado de herramientas de codificación de IA se ha vuelto mucho más competitivo en el último año debido a la intensa demanda de los usuarios. Cursor superó los 500 millones de dólares en ingresos recurrentes anuales (ARR) a principios de 2025, y Windsurf, un editor de código similar, fue objeto de un caótico intento de adquisición que dividió su equipo entre Google y Cognition.
OpenAI afirma que GPT-5-Codex supera a GPT-5 en SWE-bench Verified, un punto de referencia que mide las capacidades de codificación de agentes, así como el rendimiento en tareas de refactorización de código de grandes repositorios consolidados.
La compañía también afirma haber entrenado a GPT-5-Codex para realizar revisiones de código y haber solicitado a ingenieros de software con experiencia que evaluaran los comentarios de revisión del modelo. Según se informa, los ingenieros descubrieron que GPT-5-Codex presentaba menos comentarios incorrectos y añadía más comentarios de alto impacto.
En una sesión informativa, Alexander Embiricos, líder de producto de Codex en OpenAI, afirmó que gran parte del aumento del rendimiento se debía a las dinámicas capacidades de pensamiento de GPT-5-Codex. Los usuarios podrían estar familiarizados con el enrutador de GPT-5 en ChatGPT, que dirige las consultas a diferentes modelos según la complejidad de una tarea. Embiricos explicó que GPT-5-Codex funciona de forma similar, pero no tiene un enrutador integrado y puede ajustar el tiempo de trabajo en una tarea en tiempo real.
Embriicos afirma que esto supone una ventaja en comparación con un enrutador, que decide cuánta potencia computacional y tiempo emplear en un problema desde el principio. En cambio, GPT-5-Codex puede decidir, tras cinco minutos de resolver un problema, que necesita dedicar otra hora. Embiricos comentó que ha visto que el modelo tarda más de siete horas en algunos casos.