Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
IA de visión

OpenAI o1: Una nueva serie de modelos de OpenAI para el razonamiento de IA

Infórmate sobre los nuevos modelos OpenAI o1 y qué los hace especiales. También analizaremos cómo funcionan y su impacto en el futuro de la IA.

ABAbirami Vina
5 min read
OpenAI o1, una nueva serie de modelos de OpenAI para el razonamiento de IA

La comunidad de IA ha estado llena de especulaciones sobre el siguiente paso para los modelos GPT de OpenAI, y muchos se refieren a ello como "Project Strawberry". La razón de esto es que si le pides a GPT-4o cuántas R hay en la palabra "strawberry", te dirá que hay dos R en la palabra "strawberry". Puede parecer extraño, teniendo en cuenta lo potente que es GPT-4o. Sin embargo, el modelo está diseñado para procesar el subtexto, no las palabras exactas. Se rumoreaba que el próximo modelo intentaría solucionar esto. Sam Altman alimentó aún más estos rumores al publicar fotos de fresas en su cuenta de X (anteriormente conocida como Twitter).

¡Con el último anuncio de OpenAI el jueves 12 de septiembre, finalmente tenemos una respuesta a la especulación! Se ha lanzado OpenAI o1, una nueva serie de modelos de IA diseñados para tomarse su tiempo y pensar antes de responder. Curiosamente, ¡OpenAI o1 puede razonar mejor y responder correctamente a la pregunta sobre las fresas! En este artículo, hablaremos de qué es OpenAI o1, cómo funciona, dónde se puede utilizar y qué significa para el futuro de la IA. ¡Empecemos!

Un ejemplo de cómo pedirle a OpenAI o1 información sobre fresas

Fig 1. Un ejemplo de cómo pedirle a OpenAI o1 información sobre fresas.

Link to this sectionNuevos avances en IA por parte de OpenAI#

En julio de 2024, los ejecutivos de OpenAI compartieron que la investigación de OpenAI se acerca a un nivel humano de resolución de problemas, denominado nivel 2 de IA. Está claro que este nivel se centra en el razonamiento, ya que OpenAI presenta su nueva serie de modelos, OpenAI o1, como algo que piensa antes de responder. OpenAI o1 es un nuevo LLM (modelo de lenguaje grande), un modelo de IA que entiende y genera texto similar al humano aprendiendo patrones a partir de cantidades masivas de datos lingüísticos. Ha sido diseñado para manejar problemas complejos que requieren un razonamiento profundo.

Perspectiva de OpenAI sobre las etapas de la IA

Fig 2. Perspectiva de OpenAI sobre las etapas de la IA.

El modelo ha sido entrenado utilizando aprendizaje por refuerzo, una técnica en la que el modelo aprende a tomar mejores decisiones mediante ensayo y error al recibir recompensas o penalizaciones por sus acciones. El algoritmo de aprendizaje por refuerzo ayuda al modelo a pensar de forma más eficaz siguiendo una cadena de pensamiento. OpenAI también compartió que el rendimiento de o1 mejora continuamente con más aprendizaje por refuerzo durante el entrenamiento y con más tiempo dedicado a "pensar" durante la resolución de problemas, lo que demuestra que tanto un entrenamiento prolongado como un procesamiento reflexivo ayudan a potenciar las capacidades del modelo.

Aunque OpenAI o1 es un avance significativo para el razonamiento complejo, sigue siendo un modelo temprano y carece de algunas funciones que hacen que ChatGPT sea útil, como navegar por la web o subir archivos e imágenes. Para muchas tareas comunes, es posible que GPT-4o siga siendo más capaz por ahora. Sin embargo, OpenAI o1 marca un gran paso adelante en la capacidad de la IA para manejar el razonamiento complejo, razón por la cual OpenAI está iniciando una nueva serie y llamándola OpenAI o1.

Link to this sectionCómo mejoran el razonamiento de la IA los nuevos modelos de OpenAI#

OpenAI o1 puede utilizarse para tareas como descifrar códigos, resolver desafíos de programación, responder problemas matemáticos, abordar crucigramas e incluso tratar temas complejos en ciencia, seguridad y salud. En un guiño divertido al nombre en clave del proyecto, OpenAI mostró las habilidades de razonamiento del modelo al descifrar un código que revelaba el mensaje "HAY TRES R EN STRAWBERRY".

Más allá de resolver cifrados, OpenAI o1 también tiene habilidades para la programación. Tiene un buen desempeño en desafíos de programación competitiva como los de Codeforces, una plataforma donde los programadores resuelven problemas de codificación complejos bajo condiciones cronometradas. En estos desafíos, el modelo logra altas puntuaciones Elo (un sistema de puntuación que mide los niveles de habilidad basados en el desempeño contra otros competidores) y supera a los modelos anteriores. También destaca en matemáticas y tiene un buen desempeño en exámenes como el American Invitational Mathematics Examination (AIME).

Evaluación comparativa de las capacidades de programación de o1

Fig 3. Evaluación comparativa de las capacidades de codificación de o1.

Estos avances posicionan a OpenAI o1 como una actualización significativa respecto a modelos anteriores como GPT-4o. Abre nuevas posibilidades para la IA en áreas como negocios, desarrollo, investigación y salud. Por ejemplo, en investigación genética, OpenAI o1 puede revisar rápidamente una gran cantidad de artículos de investigación, extrayendo hallazgos clave y conexiones entre marcadores genéticos y enfermedades. Entiende el lenguaje científico complejo y puede resumir puntos importantes, ayudando a los investigadores a centrarse en la información más relevante.

Link to this sectionUn vistazo más de cerca a la cadena de pensamiento#

Vimos anteriormente que OpenAI o1 introduce un proceso de razonamiento de "Cadena de Pensamiento". Permite al modelo abordar problemas complejos de una manera similar a las estrategias cognitivas humanas. El modelo puede dividir los desafíos en pasos más pequeños y manejables y refinar iterativamente su enfoque. A diferencia de los modelos anteriores que dependían del reconocimiento de patrones inmediato, o1 optimiza su toma de decisiones explorando múltiples vías de razonamiento, aprendiendo tanto de los éxitos como de los errores mediante el aprendizaje por refuerzo.

OpenAI ha decidido mantener estas cadenas de pensamiento en bruto ocultas a los usuarios, ofreciendo en su lugar resúmenes que brindan información sobre el razonamiento del modelo sin exponer cada paso. Esta decisión ayuda a prevenir el uso indebido del proceso de pensamiento del modelo, al tiempo que permite a los desarrolladores monitorear y refinar la seguridad y alineación de la IA. Al observar las cadenas ocultas internamente, los desarrolladores pueden garantizar que o1 cumpla con las directrices éticas y evite comportamientos dañinos.

Link to this sectionEvaluación comparativa de OpenAI o1#

OpenAI o1 muestra mejoras importantes respecto a GPT-4o en varias evaluaciones comparativas que ponen a prueba las habilidades de razonamiento y resolución de problemas. En el American Invitational Mathematics Examination (AIME) 2024, un examen de matemáticas desafiante para estudiantes destacados de secundaria, o1 logró una tasa de precisión del 74% con solo una muestra por problema, en comparación con el 12% de GPT-4o. Con un consenso entre 64 muestras, su precisión aumentó al 83%, y al utilizar un método refinado de re-clasificación con 1,000 muestras, alcanzó el 93%, situándolo entre los 500 mejores estudiantes a nivel nacional.

Más allá de las matemáticas, o1 también tuvo un desempeño excepcionalmente bueno en evaluaciones comparativas que prueban el conocimiento científico, como el GPQA Diamond, que cubre preguntas de nivel de doctorado en química, física y biología. Sorprendentemente, o1 superó a expertos humanos con doctorado en esta prueba, convirtiéndose en el primer modelo de IA en lograrlo. También superó a GPT-4o en 54 de las 57 categorías en la evaluación comparativa MMLU, que prueba la comprensión en un conjunto diverso de materias, incluyendo historia, derecho y ciencia.

Evaluación comparativa de OpenAI o1

Fig 4. Evaluación comparativa de OpenAI o1.

Link to this sectionEmpieza a trabajar con OpenAI o1#

OpenAI ha introducido dos nuevos modelos de IA en la serie o1: o1-preview y o1-mini. El modelo o1-preview está diseñado para pensar más profundamente antes de responder, destacando en tareas de razonamiento complejo en ciencia, programación y matemáticas. Ofrece capacidades avanzadas de resolución de problemas para los usuarios que abordan proyectos desafiantes. Por el contrario, o1-mini es un modelo más pequeño, más rápido y más rentable, optimizado específicamente para el razonamiento en STEM, particularmente en matemáticas y programación. Si bien puede tener un conocimiento general más limitado, o1-mini iguala casi el rendimiento de o1-preview en evaluaciones clave como la competencia de matemáticas AIME y los desafíos de programación de Codeforces, todo ello a un costo un 80% menor.

Comparación de modelos de OpenAI

Fig 5. Comparación de los modelos de OpenAI.

Puedes probar estos modelos a través de varias plataformas de OpenAI. Los usuarios de ChatGPT Plus y Team pueden acceder tanto a o1-preview como a o1-mini a través del selector de modelos, experimentando capacidades de razonamiento mejoradas directamente en ChatGPT. Los desarrolladores con acceso al nivel 5 de uso de la API pueden comenzar a crear prototipos con estos modelos, aunque algunas características avanzadas todavía están en desarrollo. OpenAI también planea hacer que o1-mini esté disponible pronto para todos los usuarios de ChatGPT Free. Al explorar estos modelos, puedes experimentar de primera mano los avances en el razonamiento de la IA y elegir el que mejor se adapte a tus necesidades.

Link to this sectionConsideraciones éticas de la IA hechas por OpenAI#

OpenAI se ha centrado en la ética y la seguridad al desarrollar la serie de modelos o1. Antes de lanzar los modelos o1-preview y o1-mini, realizaron evaluaciones exhaustivas, que incluyeron pruebas externas y controles internos para detectar riesgos como contenido no permitido, alucinaciones y sesgos. Los modelos están diseñados con capacidades de razonamiento avanzadas para comprender y seguir mejor las reglas de seguridad.

OpenAI también ha implementado salvaguardas como listas de bloqueo y clasificadores de seguridad para gestionar los riesgos. El modelo o1 tiene una calificación de riesgo general media. Tiene riesgos bajos en áreas como la ciberseguridad y la autonomía del modelo, y riesgos medios en áreas como el contenido CBRN (Químico, Biológico, Radiológico y Nuclear) y la persuasión. El Grupo Asesor de Seguridad y la Junta Directiva de OpenAI han revisado estas medidas de seguridad para garantizar que el modelo sea seguro y ético de usar.

Tarjeta de resultados de OpenAI o1

Fig 6. Cuadro de mando de OpenAI o1.

Link to this sectionDe los rumores a la realidad: OpenAI o1 toma el escenario#

OpenAI o1 es un gran paso adelante en el razonamiento de la IA, convirtiendo algunos de los primeros rumores en realidad. A diferencia de GPT-4o, la serie o1 piensa más profundamente utilizando un enfoque de "Cadena de Pensamiento", dividiendo problemas complejos en pasos más pequeños para obtener mejores respuestas. Actualmente disponible como una vista previa temprana en ChatGPT y la API, OpenAI planea añadir funciones como la navegación web y la carga de archivos e imágenes. OpenAI también compartió que planea seguir desarrollando y lanzando modelos en la serie GPT, junto con la nueva serie OpenAI o1. A medida que la IA sigue evolucionando, avances como estos están allanando el camino para sistemas de IA más potentes, intuitivos y versátiles que pueden asistir y entender mejor las necesidades humanas.

¡Mantente al tanto de las últimas novedades en IA uniéndote a nuestra comunidad! Dirígete a nuestro repositorio de GitHub para ver cómo somos pioneros en soluciones de IA en sectores como la fabricación y la salud. 🚀

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático