Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
IA de vision

OpenAI o1 : une nouvelle série de modèles OpenAI pour le raisonnement par IA

Découvre les nouveaux modèles OpenAI o1 et ce qui les rend spéciaux. Nous examinerons également comment ils fonctionnent et leur impact sur l'avenir de l'IA.

ABAbirami Vina
5 min read
OpenAI o1, une nouvelle série de modèles OpenAI pour le raisonnement par IA

La communauté de l'IA bouillonne de spéculations sur la prochaine étape des modèles GPT d'OpenAI, beaucoup faisant référence à ce projet sous le nom de « Project Strawberry ». La raison en est que si tu sollicites GPT-4o en lui demandant combien de R contient le mot « strawberry », il te répondra qu'il y a deux R dans le mot « strawberry ». Cela peut sembler étrange, compte tenu de la puissance de GPT-4o. Cependant, le modèle est conçu pour traiter le sous-texte, et non les mots exacts. Il a été suggéré que le prochain modèle viserait à résoudre ce problème. Sam Altman a alimenté ces rumeurs en publiant des photos de fraises sur son compte X (anciennement connu sous le nom de Twitter).

Avec la dernière annonce d'OpenAI ce jeudi 12 septembre, nous avons enfin une réponse à ces spéculations ! OpenAI o1, une nouvelle série de modèles d'IA conçus pour prendre le temps de réfléchir avant de répondre, a été publiée. Il est intéressant de noter qu'OpenAI o1 peut mieux raisonner et répondre correctement à la question sur les fraises ! Dans cet article, nous discuterons de ce qu'est OpenAI o1, de son fonctionnement, de ses cas d'utilisation et de ce qu'il signifie pour l'avenir de l'IA. Commençons !

Un exemple de prompt envoyé à OpenAI o1 concernant les fraises

Fig 1. Un exemple de question posée à OpenAI o1 sur les fraises.

Link to this sectionNouvelles avancées dans l'IA par OpenAI#

En juillet 2024, les dirigeants d'OpenAI ont partagé que la recherche d'OpenAI approche d'un niveau humain de résolution de problèmes, qualifié de niveau 2 de l'IA. Il est clair que ce niveau se concentre sur le raisonnement, alors qu'OpenAI présente sa nouvelle série de modèles, OpenAI o1, comme capable de réfléchir avant de répondre. OpenAI o1 est un nouveau LLM (grand modèle de langage), un modèle d'IA qui comprend et génère du texte de type humain en apprenant des modèles à partir d'énormes quantités de données linguistiques. Il a été conçu pour gérer des problèmes complexes nécessitant un raisonnement approfondi.

La perspective d'OpenAI sur les étapes de l'IA

Fig 2. La perspective d'OpenAI sur les étapes de l'IA.

Le modèle a été entraîné en utilisant l'apprentissage par renforcement, une technique où le modèle apprend à prendre de meilleures décisions par essai et erreur en recevant des récompenses ou des pénalités pour ses actions. L'algorithme d'apprentissage par renforcement aide le modèle à réfléchir plus efficacement en suivant une chaîne de pensée. OpenAI a également partagé que les performances d'o1 continuent de s'améliorer avec plus d'apprentissage par renforcement pendant l'entraînement et avec plus de temps passé à « réfléchir » lors de la résolution de problèmes, montrant qu'un entraînement prolongé et un traitement réfléchi contribuent à stimuler les capacités du modèle.

Bien qu'OpenAI o1 représente une avancée significative pour le raisonnement complexe, il s'agit encore d'un modèle précoce qui manque de certaines fonctionnalités qui rendent ChatGPT utile, telles que la navigation sur le Web ou le téléchargement de fichiers et d'images. Pour de nombreuses tâches courantes, GPT-4o pourrait encore être plus performant pour le moment. Cependant, OpenAI o1 marque un grand pas en avant dans la capacité de l'IA à gérer le raisonnement complexe, c'est pourquoi OpenAI lance une nouvelle série et l'appelle OpenAI o1.

Link to this sectionComment les nouveaux modèles OpenAI améliorent le raisonnement par IA#

OpenAI o1 peut être utilisé pour des tâches comme le décodage de chiffres, la résolution de défis de programmation, la réponse à des problèmes mathématiques, la résolution de mots croisés et même la gestion de sujets complexes en science, sécurité et santé. Dans un clin d'œil amusant au nom de code du projet, OpenAI a démontré les compétences de raisonnement du modèle en déchiffrant un code qui révélait le message « THERE ARE THREE R’S IN STRAWBERRY ».

Au-delà du décodage de chiffres, OpenAI o1 est également doué pour le codage. Il fonctionne bien dans les défis de programmation compétitive comme ceux sur Codeforces, une plateforme où les programmeurs résolvent des problèmes de codage complexes sous contrainte de temps. Dans ces défis, le modèle atteint des scores Elo élevés (un système de notation qui mesure les niveaux de compétence basés sur la performance par rapport à d'autres concurrents) et surpasse les modèles précédents. Il excelle également en mathématiques et obtient de bons résultats aux examens comme l'American Invitational Mathematics Examination (AIME).

Évaluation des capacités de codage de o1

Fig 3. Benchmarking des capacités de codage d'o1.

Ces avancées positionnent OpenAI o1 comme une mise à niveau significative par rapport aux modèles précédents comme GPT-4o. Il ouvre de nouvelles possibilités pour l'IA dans des domaines tels que le business, le développement, la recherche et la santé. Par exemple, dans la recherche en génétique, OpenAI o1 peut rapidement passer en revue un grand nombre d'articles de recherche, en extrayant les principales conclusions et les liens entre les marqueurs génétiques et les maladies. Il comprend le langage scientifique complexe et peut résumer les points importants, aidant les chercheurs à se concentrer sur les informations les plus pertinentes.

Link to this sectionUn regard plus approfondi sur la chaîne de pensée#

Nous avons vu précédemment qu'OpenAI o1 introduit un processus de raisonnement par « Chaîne de pensée ». Il permet au modèle de s'attaquer à des problèmes complexes d'une manière similaire aux stratégies cognitives humaines. Le modèle peut décomposer les défis en étapes plus petites et gérables et affiner de manière itérative son approche. Contrairement aux modèles précédents qui reposaient sur la reconnaissance de formes immédiate, o1 optimise sa prise de décision en explorant plusieurs chemins de raisonnement, apprenant à la fois des succès et des erreurs grâce à l'apprentissage par renforcement.

OpenAI a décidé de garder ces chaînes de pensée brutes cachées aux utilisateurs, offrant plutôt des résumés qui donnent un aperçu du raisonnement du modèle sans exposer chaque étape. Cette décision aide à prévenir l'utilisation abusive du processus de pensée du modèle tout en permettant aux développeurs de surveiller et d'affiner la sécurité et l'alignement de l'IA. En observant les chaînes cachées en interne, les développeurs peuvent s'assurer qu'o1 respecte les directives éthiques et évite les comportements nuisibles.

Link to this sectionBenchmarking d'OpenAI o1#

OpenAI o1 montre des améliorations majeures par rapport à GPT-4o dans plusieurs benchmarks qui testent les capacités de raisonnement et de résolution de problèmes. À l'American Invitational Mathematics Examination (AIME) 2024, un examen de mathématiques difficile pour les meilleurs lycéens, o1 a atteint un taux de précision de 74 % avec seulement un échantillon par problème, contre 12 % pour GPT-4o. Avec un consensus sur 64 échantillons, sa précision est passée à 83 %, et en utilisant une méthode de re-ranking raffinée avec 1 000 échantillons, il a atteint 93 %, se classant parmi les 500 meilleurs étudiants au niveau national.

Au-delà des mathématiques, o1 a également obtenu des résultats exceptionnels sur des benchmarks testant les connaissances scientifiques, comme le GPQA Diamond, qui couvre des questions de niveau doctorat en chimie, physique et biologie. Remarquablement, o1 a surpassé des experts humains titulaires d'un doctorat lors de ce test, ce qui en fait le premier modèle d'IA à le faire. Il a également surpassé GPT-4o dans 54 des 57 catégories du benchmark MMLU, qui teste la compréhension sur un ensemble diversifié de sujets, incluant l'histoire, le droit et la science.

Évaluation d'OpenAI o1

Fig 4. Benchmarking d'OpenAI o1.

Link to this sectionPrends en main OpenAI o1#

OpenAI a introduit deux nouveaux modèles d'IA dans la série o1 : o1-preview et o1-mini. Le modèle o1-preview est conçu pour réfléchir plus profondément avant de répondre, excellant dans les tâches de raisonnement complexes en science, codage et mathématiques. Il offre des capacités de résolution de problèmes avancées pour les utilisateurs travaillant sur des projets exigeants. En revanche, o1-mini est un modèle plus petit, plus rapide et plus économique, optimisé spécifiquement pour le raisonnement STEM, en particulier les mathématiques et le codage. Bien qu'il puisse avoir une connaissance du monde moins large, o1-mini égale presque les performances d'o1-preview sur des évaluations clés comme le concours de mathématiques AIME et les défis de codage Codeforces, le tout pour un coût réduit de 80 %.

Comparaison des modèles OpenAI

Fig 5. Comparaison des modèles OpenAI.

Tu peux essayer ces modèles via différentes plateformes OpenAI. Les utilisateurs de ChatGPT Plus et Team peuvent accéder à la fois à o1-preview et o1-mini via le sélecteur de modèles, expérimentant des capacités de raisonnement améliorées directement dans ChatGPT. Les développeurs ayant un accès API de niveau 5 peuvent commencer à prototyper avec ces modèles, bien que certaines fonctionnalités avancées soient encore en développement. OpenAI prévoit également de rendre o1-mini disponible pour tous les utilisateurs de ChatGPT Free bientôt. En explorant ces modèles, tu peux faire l'expérience directe des avancées dans le raisonnement par IA et choisir celui qui correspond le mieux à tes besoins.

Link to this sectionConsidérations sur l'IA éthique prises par OpenAI#

OpenAI s'est concentré sur l'éthique et la sécurité lors du développement de la série de modèles o1. Avant de publier les modèles o1-preview et o1-mini, ils ont mené des évaluations approfondies, incluant des tests externes et des contrôles internes pour les risques tels que le contenu non autorisé, les hallucinations et les biais. Les modèles sont conçus avec des capacités de raisonnement avancées pour mieux comprendre et suivre les règles de sécurité.

OpenAI a également mis en œuvre des mesures de protection comme des listes de blocage et des classificateurs de sécurité pour gérer les risques. Le modèle o1 a un indice de risque global moyen. Il présente des risques faibles dans des domaines comme la cybersécurité et l'autonomie du modèle, et des risques moyens dans des domaines tels que le contenu CBRN (chimique, biologique, radiologique et nucléaire) et la persuasion. Le groupe consultatif sur la sécurité et le conseil d'administration d'OpenAI ont examiné ces mesures de sécurité pour s'assurer que le modèle est sûr et éthique à utiliser.

Tableau de score d'OpenAI o1

Fig 6. Scorecard d'OpenAI o1.

Link to this sectionDes rumeurs à la réalité : OpenAI o1 entre en scène#

OpenAI o1 est un grand pas en avant dans le raisonnement par IA, transformant certaines des premières rumeurs en réalité. Contrairement à GPT-4o, la série o1 réfléchit plus profondément en utilisant une approche de « Chaîne de pensée », décomposant les problèmes complexes en étapes plus petites pour de meilleures réponses. Actuellement disponible en avant-première dans ChatGPT et l'API, OpenAI prévoit d'ajouter des fonctionnalités comme la navigation sur le Web et le téléchargement de fichiers et d'images. OpenAI a également partagé qu'ils prévoient de continuer à développer et à publier des modèles dans la série GPT, parallèlement à la nouvelle série OpenAI o1. Alors que l'IA continue d'évoluer, des avancées comme celles-ci ouvrent la voie à des systèmes d'IA plus puissants, intuitifs et polyvalents, capables de mieux assister et comprendre les besoins humains.

Reste au courant des dernières nouveautés en IA en rejoignant notre communauté ! Rends-toi sur notre répertoire GitHub pour voir comment nous sommes pionniers dans les solutions d'IA dans des secteurs tels que la fabrication et la santé. 🚀

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique