Tras algunos retrasos, GPT-5 ya es una realidad, el primer modelo de lenguaje todo en uno de OpenAI, más sencillo de usar que los anteriores, y además gratis. Pero también tiene sus puntos débiles.
GPT-5 ya os oficial: el primer modelo de IA unificado y un paso más hacia la AGI
Imagen generada con IA
Por: Juan Antonio Pascual Estapé
Ha costado, pero OpenAI acaba de lanzar GPT-5. Y lo mejor de todo, es que al contrario que sus predecesores, que al principio solo estaban disponibles para las suscripciones, es gratis para todos.
GPT-5 es el primer modelo de IA unificado de la compañía de Sam Altman. Combina las capacidades de los modelos de razonamiento o- con las respuestas rápidas de los modelos GPT-. Un paso más hacia la AGI, la Inteligencia Artificial General. Es decir, una IA que pueda hacer de todo, como los humanos.
El nuevo modelo de lenguaje grande GPT-5 también se diferencia de su predecesor en que cada vez es menos chatbot y más agente de IA. Lo de responder dudas ya es una cosa de IA de primera generación. A GPT-5 se le da mejor completar tareas encadenadas, desde crear una app desde cero a investigar.
GPT-5, una IA que no es la mejor en todo
En una charla con la prensa norteamericana, Sam Altman ha dicho que GPT-5 es «la mejor IA del mundo», en términos globales. Pero como recoge TechCrunch, en los propios benchmarks que OpenAI ha facilitado, no siempre queda la primera.
Eso sí, hace muchas cosas en segundo plano que no se ven, pero que resultan mucho más inteligentes que en sus predecesores. Por ejemplo, puede elegir el modelo de lenguaje según lo que le pidas, o cambiar su personalidad según la conversación. Para el usuario también es más sencillo de manejar, porque ya no tiene que elegir una IA específica, en función de la tarea.
OpenAI asegura que GPT-5 también detecta mejor cuándo alguien le está pidiendo algo con malas intenciones. Si le piden instrucciones que podrían crear un explosivo, causar daño, o preparar una estafa, aunque sean peticiones sutiles, lo detecta mejor que antes.
En donde ha mejorado es en las alucinaciones. Según chequeos de la propia compañía, GPT-5 ofrece datos incorrectos el 4,8% de las veces, frente al 22% de o3 y el 20,6% de GPT-4o. También asegura que «miente» menos, en el sentido de que falsea menos datos para que le den la razón, como hacen en ocasiones sus predecedores.
¿Y cómo se compara con respecto a la competencia? Los benchmarks dicen que no hay un salto significativo, e incluso en algunos, pierde con Grok, Claude, o modelos anteriores.
Lo que mejor se le da es crear código desde cero. En el test SWE-bench Verified, GPT-5 alcanza una puntuación de 74.9%, frente al 74,5% de Claude Opus 4.1 de Anthropic o el 59,6% de Gemini 2.5 Pro de Google.
Sim embargo, con el test Humanity’s Last Exam, que mide el rendimiento en Ciencia, Matemáticas y Humanidades, GPT-5 Pro se queda en una puntuación de 42%, por detrás de los 44,4% de Grok 4 Heavy. Supera a todos en el test GPQA Diamond, con conocimientos de ciencias de nivel doctorado.
Sus habilidades agénticas tampoco son top. Con au-bench, que mide la capacidad de navegar por webs de vuelos, queda por debajo de o3. Moviéndose por webs de tiendas, no supera a Claude Opus 4.1.
Ha mejorado mucho en los temas médicos y de salud, un apartado en donde los chatbots están recibiendo muchas críticas. En el test HealthBench Hard Hallucinations, solo alucina en el 1,6% de los datos, frente al 12,9% de GPT-4o y el 15,8% de o3.
OpenAI también asegura que GPT-5 es superior en aspectos que no se pueden medir con bechmarks, como la escritura o el diseño creativo.
Diferentes versiones de GPT-5, gratis para todos
Por primera vez, la compañía de Sam Altman ofrece GPT-5 gratis para todos desde el primer día, aunque lógicamente los usuarios de pago tienen menos limitaciones.
Los sucriptores Plus pueden usar muchas más peticiones al día que los gratuitos, y los Pro obtienen acceso ilimitado, y la versión profesional, GPT-5 Pro.
Tal como ha filtrado GitHub antes de tiempo esta mañana, GPT-5 está disponible en diferentes versiones:
GPT-5. Para el diseño de tareas lógicas y, a nivel general, el que podrán usar los usuarios para tareas menos específicas.
GPT-5-mini. Una versión ligera del modelo anterior, con menor capacidad de razonamiento, aunque ideal para presupuestos más ajustados.
GPT-5-nano. El modelo ideal para tareas que requieran mayor velocidad de procesamiento, así como aplicaciones que necesiten de baja latencia.
GPT-5-chat. Conversaciones con un estilo natural y multimodal.
Como vemos, GPT-5 no supone un salto espectacular en términos de rendimiento, aunque hay mejoras en creación de código, alucinaciones, creatividad, y gestión de temas de salud.
Su principal virtud es su condición de modelo de IA unificado, que vale para todo. Ese parece ser el futuro de los modelos de lenguaje, un paso más hace la AGI.