La IA de segunda generación ya está aquí: OpenAI presenta o1, la IA que razona.

OpenAI vuelve a hacerlo. Arranca oficialmente la nueva generación de IA con o1, antes conocida como Strawberry.

La IA de segunda generación ya está aquí: OpenAI presenta o1, la IA que razona

Imagen generada con Dall-E 3

Por: Juan Antonio Pascual Estapé

La nueva inteligencia artificial de OpenAI, llamada o1, es la primera que razona. No va a sustituir a GPT (de momento), pero puede hacer muchas cosas mucho mejor que el actual modelo de lenguaje de OpenAI. En concreto, todo lo que implique razonar: matemáticas, lógica, crear código, etc.

Esta nueva IA, o1, es la segunda generación de inteligencia artificial de la compañía, que conocíamos como Open AI Strawberry. Es la primera IA capaz de pararse a pensar, y deducir su respuesta. Es decir, llega a conclusiones más allá de su entrenamiento.

De momento OpenAI ha presentado dos versiones, o1-preview, y o1-mini. O1-preview se llama así porque OpenAI quiere dejar claro que no está terminada. O1-mini es un 80% más barata, y está pensada para tareas más sencillas, que no exijan demasiados encadenamientos lógicos.

Así funciona o1, la IA que razona

Tanto el entrenamiento como el funcionamiento de o1, son muy diferentes a los de GPT. La nueva o1 está diseñada para resolver problemas que exijan un encadenamiento de ideas.

Como hacemos los humanos, o1 estudia un problema, lo divide en partes más pequeñas y sencillas, y las va encadenando para resolver el desafío.

O1 es capaz de completar este problema de lógica y matemáticas por su cuenta: «Una princesa tiene la edad que tendrá el príncipe cuando la princesa tenga el doble de la edad que tenía el príncipe cuando la edad de la princesa era la mitad de la suma de sus edades actuales. ¿Cuál es la edad del príncipe y de la princesa? Proporciona todas las soluciones a esa pregunta».

Qué es el proyecto Strawberry de OpenAI, el tipo de IA que igualará el nivel intelectual del ser humano

Proyecto Strawberry OpenAI

GPT-4o también puede hacerlo, pero hay que usar varios prompts para que llegue a la solución. Es decir, hay que darle los pasos uno a uno, mientras que o1 los razona ella misma. Otra ventaja es que sufre menos alucinaciones, aunque no las ha eliminado por completo.

A cambio, o1 es más lenta que GPT dando respuestas. Según su complejidad, puede tardar entre 30 segundos y un minuto.

OpenAI asegura que tiene un rendimiento similar al de los estudiantes de doctorado en tareas de física, química y biología. También destaca en matemáticas y codificación.

En un examen clasificatorio para la Olimpiada Internacional de Matemáticas (IMO), GPT-4o solo resolvió correctamente el 13% de los problemas, mientras que o1 obtuvo un 83%. Sus habilidades de codificación se evaluaron en concursos y alcanzaron el percentil 89 en las competiciones de Codeforces.

Como vemos, o1 es mejor que GPT en todo lo que tenga que ver con el razonamiento. Pero es peor en todo lo demás. De momento no es competitiva en tareas como buscar información en Internet, o crear imágenes.

O1-preview y o1-mini ya se pueden probar gratis si tienes una cuenta ChatGPT Plus o ChatGPT Team. Pronto estarán disponible para todos, incluido los usuarios gratuitos. Aquellos que quieran usarlas sin limitaciones, su precio es entre 3 y 4 veces más alto que GPT.

La segunda generación de IA ya está aquí. La nueva IA de OpenAI, o1, es capaz de razonar para resolver problemas más allá de su entrenamiento. Un paso más hacia su completa humanización.

Comentarios