🚀 OpenAI lanza O1
🙋‍♀️ ¿Cómo funciona?
¿En qué punto se encuentra O1?
Cómo probar O1
😮 El futuro

OpenAI O1: Un nuevo paradigma en IA

OpenAI ha lanzado un nuevo modelo insignia llamado O1, que puede "razonar" sobre sí mismo, dando lugar a un nuevo paradigma en IA y LLMs

🚀 OpenAI lanza O1

OpenAI acaba de lanzar su nuevo modelo O1 que puede "razonar" sobre sí mismo antes de responder a la consulta de un usuario, destrozando benchmakrs en todos los ámbitos para tareas complejas.

El nuevo modelo de OpenAI, también codificado "strawberry/Q*" internamente, fue rumoreado durante mucho tiempo, dando lugar incluso a teorías conspirativas como "¿Qué ha visto Ilya?" en Twitter. Hacía tiempo que se sospechaba que se trataba de un modelo que razonaba y mejoraba por sí mismo, y ahora ha salido a la luz.

🙋‍♀️ ¿Cómo funciona?

OpenAI O1 o fresa es un modelo de autorrazonamiento que puede razonar múltiples pasos antes de responder a la pregunta. El modelo descompone una tarea compleja en pasos e intenta resolverla a continuación. También es capaz de autocriticarse, lo que significa que puede autocorregirse si va en la dirección equivocada en función del contexto.

Esto es muy similar al funcionamiento de COT o cadena de pensamiento, pero la diferencia clave es que los pasos de COT se entrenan mediante RL, lo que abre un nuevo paradigma de escalado. De ahí el retroceso en la denominación a "O1" desde GPT-4o.

Los LLM anteriores tenían un largo paso de preentrenamiento en el que se utilizaba una gran cantidad de cálculo para que el LLM creara un modelo mundial y capturara toda la información. Luego, en el momento de la prueba (es decir, cuando le hacemos una pregunta), sólo tiene que responder directamente basándose en lo que ha aprendido. Pero ahora con O1, el LLM toma múltiples pasos para razonar por sí mismo sobre la entrada y luego da una respuesta. Al principio, con O1 los pasos de razonamiento son comparativamente más pequeños, es decir, entre 10 y 20 pasos que tardan entre 15 y 20 segundos, pero OpenAI planea ampliarlos a horas, días y semanas. Imagina que le pides a un LLM que formule una cura para el cáncer y luego razona durante semanas y da la respuesta.

¿En qué punto se encuentra O1?

En términos de pruebas, O1 destroza todas las pruebas más complejas cuando se compara con GPT-4o (y por extensión con Claude Sonnet 3.5). En este caso, las tareas complejas son escribir código, comprender y analizar un PRD, revisar un informe médico o escribir una novela. Básicamente cualquier cosa que requiera pensamiento crítico.

Pero, por otro lado, O1 está capado en las capacidades básicas y a veces rinde incluso peor que GPT-4o en tareas sencillas como escribir un mensaje personal o editar un blog.

Cómo probar O1

¡Pasemos ahora a cómo podemos usar O1! Actualmente los usuarios de ChatGPT Plus pueden usar O1 directamente en chatGPT pero con límites de velocidad muy estrictos.

O1-preview : 30 solicitudes por semanaO1-mini : 50 solicitudes por semana

También puedes consultar O1 a través de Merlin Pro, ¡con límites de tarifa mucho mejores!

😮 El futuro

OpenAI O1 es un gran paso, no es sólo un nuevo modelo después de gpt-4o, pero es una nueva forma de formación LLMs, pensando en el cálculo y significa que hay una larga pista de aterrizaje para explotar el rendimiento como sólo estamos rascando la superficie con O1-preview y hay mucho más por venir en el próximo 1 año.

La guerra de la IA, que estaba estancada, va a volver a encenderse con OpenAI estableciendo su fuerte liderazgo una vez más.

Experience the full potential of ChatGPT with Merlin