OpenAI o1 : Une nouvelle série de modèles OpenAI pour le raisonnement en IA

Abirami Vina

5 minutes de lecture

13 septembre 2024

Découvrez les modèles OpenAI o1 récemment lancés et ce qui les rend si particuliers. Nous examinerons également leur fonctionnement et leur impact sur l'avenir de l'IA.

La communauté de l'IA est en proie à des spéculations sur la prochaine étape des modèles GPT de l'OpenAI, que beaucoup qualifient de "projet Fraise". La raison en est que si vous demandez à GPT-4o combien de R il y a dans le mot "fraise", il vous répondra qu'il y a deux R dans le mot"fraise". Cela peut sembler étrange, compte tenu de la puissance de GPT-4o. Cependant, le modèle est conçu pour traiter le sous-texte, et non les mots exacts. Il a été dit que le prochain modèle viserait à résoudre ce problème. Sam Altman a alimenté ces rumeurs en publiant des photos de fraises sur son compte X (anciennement connu sous le nom de Twitter).

Avec la dernière annonce d'OpenAI le jeudi 12 septembre, nous avons enfin une réponse aux spéculations ! OpenAI o1, une nouvelle série de modèles d'IA conçus pour ralentir et réfléchir avant de répondre, a été lancée. Il est intéressant de noter qu'OpenAI o1 peut mieux raisonner et répondre correctement à la question sur les fraises ! Dans cet article, nous verrons ce qu'est l'OpenAI o1, comment elle fonctionne, où elle peut être utilisée et ce qu'elle signifie pour l'avenir de l'IA. C'est parti !

__wf_reserved_inherit
Fig. 1. Exemple d'invite à l'OpenAI o1 à propos des fraises.

Nouvelles avancées de l'OpenAI dans le domaine de l'IA

En juillet 2024, les dirigeants d'OpenAI ont indiqué que les recherches de l'entreprise s'approchaient d'un niveau humain de résolution de problèmes, appelé niveau 2 de l'IA. Il est clair que ce niveau se concentre sur le raisonnement, car OpenAI présente sa nouvelle série de modèles, OpenAI o1, comme réfléchissant avant de répondre. OpenAI o1 est un nouveau LLM (large language model), un modèle d'IA qui comprend et génère des textes de type humain en apprenant des modèles à partir de quantités massives de données linguistiques. Il a été conçu pour traiter des problèmes complexes nécessitant un raisonnement approfondi. 

__wf_reserved_inherit
Fig 2. Le point de vue de l'OpenAI sur les étapes de l'IA.

Le modèle a été formé à l'aide de l'apprentissage par renforcement, une technique dans laquelle le modèle apprend à prendre de meilleures décisions par essais et erreurs en recevant des récompenses ou des pénalités pour ses actions. L'algorithme d'apprentissage par renforcement aide le modèle à réfléchir plus efficacement en suivant une chaîne de pensée. OpenAI a également indiqué que les performances d' o1 continuent de s'améliorer grâce à l'apprentissage par renforcement au cours de l'entraînement et au temps passé à "réfléchir" pendant la résolution des problèmes, ce qui montre qu'un entraînement prolongé et un traitement réfléchi contribuent à renforcer les capacités du modèle.

Bien que l'OpenAI o1 représente une avancée significative en matière de raisonnement complexe, il s'agit encore d'un modèle précoce et il lui manque certaines fonctionnalités qui rendent le ChatGPT utile, telles que la navigation sur le web ou le téléchargement de fichiers et d'images. Pour de nombreuses tâches courantes, GPT-4o pourrait encore être plus performant pour l'instant. Cependant, OpenAI o1 marque un grand pas en avant dans la capacité de l'IA à gérer des raisonnements complexes, c'est pourquoi OpenAI commence une nouvelle série et l'appelle OpenAI o1.

Comment les nouveaux modèles OpenAI améliorent le raisonnement de l'IA

OpenAI o1 peut être utilisé pour des tâches telles que le décodage de codes chiffrés, la résolution de défis de programmation, la réponse à des problèmes mathématiques, la résolution de mots croisés et même le traitement de sujets complexes dans les domaines de la science, de la sécurité et des soins de santé. Dans un clin d'œil amusant au nom de code du projet, OpenAI a démontré les capacités de raisonnement du modèle en déchiffrant un code qui révélait le message "THERE ARE THREE R'S IN STRAWBERRY" (il y a trois R dans fraise). 

L'OpenAI o1 ne se contente pas de résoudre des problèmes de chiffrement, elle est également douée pour le codage. Elle obtient de bons résultats dans les compétitions de programmation comme celles de Codeforces, une plateforme où les programmeurs résolvent des problèmes de codage complexes dans des conditions chronométrées. Dans ces défis, le modèle obtient des notes Elo élevées (un système de notation qui mesure les niveaux de compétence en fonction des performances par rapport à d'autres concurrents) et surpasse les modèles précédents. Il excelle également en mathématiques et obtient de bons résultats à des examens tels que l'American Invitational Mathematics Examination (AIME). 

__wf_reserved_inherit
Fig. 3. Évaluation comparative des capacités de codage d'o1.

Ces avancées font de l'OpenAI o1 une amélioration significative par rapport aux modèles précédents tels que le GPT-4o. Elle ouvre de nouvelles possibilités pour l'IA dans des domaines tels que les affaires, le développement, la recherche et les soins de santé. Par exemple, dans le domaine de la recherche génétique, OpenAI o1 peut rapidement parcourir un grand nombre d'articles de recherche et en extraire les principaux résultats et les liens entre les marqueurs génétiques et les maladies. Elle comprend le langage scientifique complexe et peut résumer les points importants, aidant ainsi les chercheurs à se concentrer sur les informations les plus pertinentes. 

Un examen plus approfondi de la chaîne de pensée

Nous avons vu précédemment que l'OpenAI o1 introduit un processus de raisonnement par "chaîne de pensée". Ce processus permet au modèle de s'attaquer à des problèmes complexes d'une manière similaire aux stratégies cognitives humaines. Le modèle peut décomposer les défis en étapes plus petites et gérables et affiner son approche de manière itérative. Contrairement aux modèles précédents qui s'appuyaient sur une reconnaissance immédiate des formes, o1 optimise sa prise de décision en explorant de multiples voies de raisonnement, en tirant les leçons de ses succès et de ses erreurs grâce à l'apprentissage par renforcement.

OpenAI a décidé de ne pas dévoiler ces chaînes de pensée brutes aux utilisateurs, mais de proposer des résumés qui donnent un aperçu du raisonnement du modèle sans en dévoiler toutes les étapes. Cette décision permet d'éviter l'utilisation abusive du processus de réflexion du modèle tout en permettant aux développeurs de contrôler et d'affiner la sécurité et l'alignement de l'IA. En observant les chaînes cachées en interne, les développeurs peuvent s'assurer que o1 respecte les directives éthiques et évite les comportements nuisibles.

Analyse comparative de l'OpenAI o1

OpenAI o1 montre des améliorations majeures par rapport à GPT-4o dans plusieurs benchmarks qui testent les capacités de raisonnement et de résolution de problèmes. Pour l'American Invitational Mathematics Examination (AIME) 2024, un examen de mathématiques difficile destiné aux meilleurs élèves du secondaire, o1 a atteint un taux de précision de 74 % avec un seul échantillon par problème, contre 12 % pour GPT-4o. Avec un consensus sur 64 échantillons, sa précision est passée à 83 %, et en utilisant une méthode de reclassement raffinée avec 1 000 échantillons, elle a atteint 93 %, la plaçant parmi les 500 meilleurs étudiants au niveau national. 

Au-delà des mathématiques, o1 a également obtenu des résultats exceptionnels dans des tests de référence portant sur les connaissances scientifiques, comme le GPQA Diamond, qui couvre des questions de niveau doctoral en chimie, en physique et en biologie. Fait remarquable, o1 a surpassé des experts humains titulaires d'un doctorat dans ce test, ce qui en fait le premier modèle d'IA à y parvenir. Il a également surpassé GPT-4o dans 54 des 57 catégories du test de référence MMLU, qui évalue la compréhension d'un ensemble varié de sujets, dont l'histoire, le droit et les sciences.

__wf_reserved_inherit
Fig. 4. Analyse comparative de l'OpenAI o1.

Mettez la main à la pâte avec l'OpenAI o1

OpenAI a introduit deux nouveaux modèles d'IA dans la série o1 : o1-preview et o1-mini. Le modèle o1-preview est conçu pour réfléchir plus profondément avant de répondre, excellant dans les tâches de raisonnement complexes en science, en codage et en mathématiques. Il offre des capacités de résolution de problèmes avancées pour les utilisateurs qui s'attaquent à des projets difficiles. En revanche, o1-mini est un modèle plus petit, plus rapide et plus rentable, optimisé spécifiquement pour le raisonnement STEM, en particulier les mathématiques et le codage. Bien que sa connaissance du monde soit moins étendue, o1-mini est presque aussi performant que o1-preview lors d'évaluations clés telles que le concours de mathématiques AIME et les défis de codage Codeforces, et ce pour un coût inférieur de 80 %.

__wf_reserved_inherit
Fig. 5. Comparaison des modèles OpenAI.

Vous pouvez essayer ces modèles sur différentes plateformes OpenAI. Les utilisateurs de ChatGPT Plus et Team peuvent accéder à o1-preview et o1-mini via le sélecteur de modèle, expérimentant ainsi des capacités de raisonnement améliorées directement dans ChatGPT. Les développeurs ayant accès au niveau 5 d'utilisation de l'API peuvent commencer à créer des prototypes avec ces modèles, bien que certaines fonctionnalités avancées soient encore en cours de développement. OpenAI prévoit également de mettre o1-mini à la disposition de tous les utilisateurs de ChatGPT Free prochainement. En explorant ces modèles, vous pouvez expérimenter directement les avancées en matière de raisonnement IA et choisir celui qui correspond le mieux à vos besoins.

Considérations éthiques sur l'IA formulées par l'OpenAI

OpenAI a mis l'accent sur l'éthique et la sécurité lors du développement de la série de modèles o1. Avant de publier les modèles o1-preview et o1-mini, l'entreprise a procédé à des évaluations approfondies, y compris des tests externes et des vérifications internes pour détecter les risques tels que les contenus interdits, les hallucinations et les préjugés. Les modèles sont conçus avec des capacités de raisonnement avancées pour mieux comprendre et respecter les règles de sécurité. 

OpenAI a également mis en place des mesures de protection telles que des listes de blocage et des classificateurs de sécurité pour gérer les risques. Le modèle o1 présente un risque global moyen. Il présente des risques faibles dans des domaines tels que la cybersécurité et l'autonomie du modèle, et des risques moyens dans des domaines tels que le contenu CBRN (chimique, biologique, radiologique et nucléaire) et la persuasion. Le groupe consultatif sur la sécurité et le conseil d'administration d'OpenAI ont examiné ces mesures de sécurité pour s'assurer que le modèle est sûr et éthique à utiliser.

__wf_reserved_inherit
Fig. 6. Fiche d'évaluation de l'OpenAI o1.

De la rumeur à la réalité : L'OpenAI o1 entre en scène

OpenAI o1 est un grand pas en avant dans le raisonnement de l'IA, transformant certaines des premières rumeurs en réalité. Contrairement à GPT-4o, la série o1 réfléchit plus en profondeur en utilisant une approche de "chaîne de pensée", décomposant les problèmes complexes en étapes plus petites pour de meilleures réponses. Actuellement disponible en avant-première dans ChatGPT et l'API, OpenAI prévoit d'ajouter des fonctionnalités telles que la navigation sur le web et le téléchargement de fichiers et d'images. OpenAI a également indiqué qu'elle prévoyait de continuer à développer et à publier des modèles dans la série GPT, parallèlement à la nouvelle série OpenAI o1. Alors que l'IA continue d'évoluer, des avancées comme celles-ci ouvrent la voie à des systèmes d'IA plus puissants, plus intuitifs et plus polyvalents, capables de mieux assister et comprendre les besoins humains.

Restez au courant des dernières nouveautés en matière d'IA en rejoignant notre communauté! Dirigez-vous vers notre dépôt GitHub pour voir comment nous sommes pionniers en matière de solutions d'IA dans des secteurs tels que la fabrication et la santé. 🚀

Construisons ensemble le futur
de l'IA !

Commencez votre voyage avec l'avenir de l'apprentissage automatique

Commencer gratuitement
Lien copié dans le presse-papiers