OpenAI o1: Eine neue Reihe von OpenAI-Modellen für KI-Schlussfolgerungen

Abirami Vina

5 Minuten lesen

13. September 2024

Erfahren Sie mehr über die neu eingeführten OpenAI o1-Modelle und was sie so besonders macht. Wir werfen auch einen Blick darauf, wie sie funktionieren und welche Auswirkungen sie auf die Zukunft der KI haben.

In der KI-Gemeinschaft wird über den nächsten Schritt für die GPT-Modelle von OpenAI spekuliert, und viele nennen ihn "Projekt Erdbeere". Der Grund dafür ist, dass GPT-4o auf die Frage, wie viele Rs das Wort "Erdbeere" enthält, antwortet, dass es zwei Rs in dem Wort"Erdbeere" gibt. Das mag seltsam erscheinen, wenn man bedenkt, wie leistungsfähig GPT-4o ist. Das Modell ist jedoch darauf ausgelegt, den Subtext zu verarbeiten, nicht die genauen Wörter. Es wurde gemunkelt, dass das nächste Modell darauf abzielen wird, dieses Problem zu lösen. Sam Altman heizte diese Gerüchte weiter an, indem er Bilder von Erdbeeren auf seinem X-Konto (früher bekannt als Twitter) veröffentlichte.

Mit der jüngsten Ankündigung von OpenAI am Donnerstag, den 12. September, haben wir endlich eine Antwort auf die Spekulationen! OpenAI o1, eine neue Serie von KI-Modellen, die langsamer werden und nachdenken, bevor sie reagieren, wurde veröffentlicht. Interessanterweise kann OpenAI o1 besser denken und die Frage nach Erdbeeren richtig beantworten! In diesem Artikel werden wir besprechen, was OpenAI o1 ist, wie es funktioniert, wo es eingesetzt werden kann und was es für die Zukunft der KI bedeutet. Legen wir los!

__wf_reserved_inherit
Abb. 1. Ein Beispiel für die Abfrage von OpenAI o1 über Erdbeeren.

Neue Fortschritte bei der KI durch OpenAI

Im Juli 2024 teilten Führungskräfte von OpenAI mit, dass sich die Forschung von OpenAI dem menschlichen Niveau der Problemlösung nähert, das als Stufe 2 der KI bezeichnet wird. Es ist klar, dass sich diese Stufe auf das Denken konzentriert, da OpenAI seine neue Modellreihe, OpenAI o1, als denkend, bevor es antwortet, vorstellt. OpenAI o1 ist ein neues LLM (Large Language Model), ein KI-Modell, das menschenähnlichen Text versteht und generiert, indem es Muster aus riesigen Mengen von Sprachdaten lernt. Es wurde entwickelt, um komplexe Probleme zu lösen, die tiefgreifende Überlegungen erfordern. 

__wf_reserved_inherit
Abbildung 2. OpenAIs Sichtweise auf die Stufen der KI.

Das Modell wurde mit Hilfe des Verstärkungslernens trainiert, einer Technik, bei der das Modell durch Versuch und Irrtum lernt, bessere Entscheidungen zu treffen, indem es Belohnungen oder Strafen für seine Handlungen erhält. Der Algorithmus des verstärkenden Lernens hilft dem Modell, effektiver zu denken, indem es einer Gedankenkette folgt. OpenAI teilte auch mit, dass sich die Leistung von o1 mit mehr Verstärkungslernen während des Trainings und mit mehr Zeit, die mit dem "Denken" während der Problemlösung verbracht wird, weiter verbessert, was zeigt, dass sowohl ein ausgedehntes Training als auch eine durchdachte Verarbeitung dazu beitragen, die Fähigkeiten des Modells zu verbessern.

OpenAI o1 ist zwar ein bedeutender Fortschritt für komplexes Denken, aber es ist immer noch ein frühes Modell und es fehlen einige Funktionen, die ChatGPT nützlich machen, wie z. B. das Surfen im Internet oder das Hochladen von Dateien und Bildern. Für viele alltägliche Aufgaben könnte GPT-4o im Moment noch leistungsfähiger sein. OpenAI o1 markiert jedoch einen großen Schritt vorwärts in der Fähigkeit der KI, komplexes Denken zu beherrschen. Aus diesem Grund startet OpenAI eine neue Serie und nennt sie OpenAI o1.

Wie die neuen OpenAI-Modelle das KI-Schlussfolgern verbessern

OpenAI o1 kann für Aufgaben wie das Entschlüsseln von Chiffren, das Lösen von Programmieraufgaben, das Beantworten von mathematischen Problemen, das Lösen von Kreuzworträtseln und sogar die Behandlung komplexer Themen in Wissenschaft, Sicherheit und Gesundheitswesen eingesetzt werden. In einer amüsanten Anspielung auf den Codenamen des Projekts zeigte OpenAI die Denkfähigkeiten des Modells, indem es eine Chiffre knackte, die die Nachricht "THERE ARE THREE R'S IN STRAWBERRY" enthüllte. 

OpenAI o1 ist nicht nur in der Lage, Chiffren zu lösen, sondern auch zu programmieren. Es zeigt gute Leistungen bei Programmierwettbewerben wie denen auf Codeforces, einer Plattform, auf der Programmierer komplexe Programmieraufgaben unter Zeitdruck lösen. Bei diesen Wettbewerben erreicht das Modell hohe Elo-Werte (ein Punktesystem, das die Fähigkeiten auf der Grundlage der Leistung anderer Teilnehmer misst) und übertrifft frühere Modelle. Es zeichnet sich auch in Mathematik aus und schneidet bei Prüfungen wie der American Invitational Mathematics Examination (AIME) gut ab. 

__wf_reserved_inherit
Abb. 3. Benchmarking der Kodierfähigkeiten von o1.

Diese Fortschritte machen OpenAI o1 zu einer deutlichen Verbesserung gegenüber früheren Modellen wie GPT-4o. Es eröffnet neue Möglichkeiten für KI in Bereichen wie Wirtschaft, Entwicklung, Forschung und Gesundheitswesen. In der Genforschung kann OpenAI o1 zum Beispiel schnell eine große Anzahl von Forschungsarbeiten durchgehen und die wichtigsten Ergebnisse und Verbindungen zwischen genetischen Markern und Krankheiten herausfinden. Es versteht komplexe wissenschaftliche Sprache und kann wichtige Punkte zusammenfassen, was den Forschern hilft, sich auf die wichtigsten Informationen zu konzentrieren. 

Ein genauerer Blick auf die Gedankenkette

Wir haben bereits gesehen, dass OpenAI o1 einen "Chain of Thought"-Gedankenprozess einführt. Er ermöglicht es dem Modell, komplexe Probleme ähnlich wie menschliche kognitive Strategien zu bewältigen. Das Modell kann Herausforderungen in kleinere, überschaubare Schritte zerlegen und seinen Ansatz iterativ verfeinern. Im Gegensatz zu früheren Modellen, die sich auf sofortige Mustererkennung verließen, optimiert o1 seine Entscheidungsfindung, indem es mehrere Argumentationspfade erkundet und durch Verstärkungslernen sowohl aus Erfolgen als auch aus Fehlern lernt.

OpenAI hat beschlossen, diese rohen Gedankenketten vor den Nutzern verborgen zu halten und stattdessen Zusammenfassungen anzubieten, die einen Einblick in die Argumentation des Modells geben, ohne jeden Schritt offenzulegen. Diese Entscheidung trägt dazu bei, den Missbrauch des Denkprozesses des Modells zu verhindern, und ermöglicht es den Entwicklern dennoch, die KI-Sicherheit und -Anpassung zu überwachen und zu verfeinern. Durch die interne Beobachtung der verborgenen Ketten können die Entwickler sicherstellen, dass o1 die ethischen Richtlinien einhält und schädliches Verhalten vermeidet.

Benchmarking von OpenAI o1

OpenAI o1 zeigt erhebliche Verbesserungen gegenüber GPT-4o in mehreren Benchmarks, die das logische Denken und die Problemlösungsfähigkeiten testen. Bei der American Invitational Mathematics Examination (AIME) 2024, einer anspruchsvollen Mathematikprüfung für die besten Schüler der High School, erreichte o1 eine Genauigkeit von 74% mit nur einer Probe pro Problem, verglichen mit 12% bei GPT-4o. Mit einem Konsens über 64 Stichproben stieg die Genauigkeit auf 83 %, und mit einer verfeinerten Methode zur Neueinstufung mit 1.000 Stichproben erreichte sie 93 %, womit sie zu den 500 besten Schülern des Landes gehörte. 

Neben der Mathematik schnitt o1 auch bei Benchmarks, die wissenschaftliches Wissen testen, wie dem GPQA Diamond, der Fragen auf Doktoranden-Niveau in Chemie, Physik und Biologie umfasst, außergewöhnlich gut ab. Bemerkenswerterweise übertraf o1 in diesem Test menschliche Experten mit Doktortitel und war damit das erste KI-Modell, dem dies gelang. Außerdem übertraf es GPT-4o in 54 von 57 Kategorien des MMLU-Benchmarks, bei dem das Verständnis für eine Vielzahl von Fächern, darunter Geschichte, Recht und Wissenschaft, getestet wird.

__wf_reserved_inherit
Abb. 4. Benchmarking OpenAI o1.

Erfahren Sie mehr über OpenAI o1

OpenAI hat zwei neue KI-Modelle der o1-Serie vorgestellt: o1-preview und o1-mini. Das Modell o1-preview ist darauf ausgelegt, tiefer zu denken, bevor es reagiert, und zeichnet sich durch komplexe Denkaufgaben in den Bereichen Wissenschaft, Programmierung und Mathematik aus. Es bietet fortgeschrittene Problemlösungsfähigkeiten für Benutzer, die anspruchsvolle Projekte angehen. Im Gegensatz dazu ist o1-mini ein kleineres, schnelleres und kostengünstigeres Modell, das speziell für MINT-Fragen, insbesondere Mathematik und Programmierung, optimiert ist. Es verfügt zwar über ein geringeres Weltwissen, aber o1-mini erreicht fast die Leistung von o1-preview bei wichtigen Evaluierungen wie dem AIME-Mathematikwettbewerb und den Codeforces-Herausforderungen, und das zu 80 % geringeren Kosten.

__wf_reserved_inherit
Abb. 5. Vergleich der OpenAI-Modelle.

Sie können diese Modelle über verschiedene OpenAI-Plattformen ausprobieren. ChatGPT Plus- und Team-Benutzer können sowohl auf o1-preview als auch auf o1-mini über die Modellauswahl zugreifen und so die erweiterten Argumentationsmöglichkeiten direkt in ChatGPT erleben. Entwickler mit API-Nutzungsstufe 5 können mit dem Prototyping mit diesen Modellen beginnen, obwohl einige erweiterte Funktionen noch in der Entwicklung sind. OpenAI plant außerdem, o1-mini bald für alle ChatGPT Free-Benutzer verfügbar zu machen. Indem Sie diese Modelle erkunden, können Sie die Fortschritte im Bereich der künstlichen Intelligenz aus erster Hand erfahren und das Modell auswählen, das Ihren Bedürfnissen am besten entspricht.

Ethische KI-Überlegungen von OpenAI

OpenAI hat bei der Entwicklung der o1-Modellreihe den Schwerpunkt auf Ethik und Sicherheit gelegt. Vor der Veröffentlichung der Modelle o1-preview und o1-mini wurden gründliche Bewertungen durchgeführt, einschließlich externer Tests und interner Prüfungen auf Risiken wie unzulässige Inhalte, Halluzinationen und Verzerrungen. Die Modelle sind mit fortschrittlichen Denkfähigkeiten ausgestattet, um Sicherheitsregeln besser zu verstehen und zu befolgen. 

OpenAI hat auch Sicherheitsvorkehrungen wie Blocklisten und Sicherheitsklassifikatoren eingeführt, um Risiken zu bewältigen. Das o1-Modell hat eine mittlere Gesamtrisikobewertung. Es weist geringe Risiken in Bereichen wie Cybersicherheit und Modellautonomie und mittlere Risiken in Bereichen wie CBRN (chemische, biologische, radiologische und nukleare) Inhalte und Überzeugungsarbeit auf. Die Safety Advisory Group und der Vorstand von OpenAI haben diese Sicherheitsmaßnahmen überprüft, um sicherzustellen, dass das Modell sicher und ethisch vertretbar ist.

__wf_reserved_inherit
Abb. 6. OpenAI o1 Scorecard.

Von Gerüchten zur Realität: OpenAI o1 betritt die Bühne

OpenAI o1 ist ein großer Schritt nach vorn in der KI-Denkweise und lässt einige der ersten Gerüchte Wirklichkeit werden. Im Gegensatz zu GPT-4o denkt die o1-Serie tiefer, indem sie einen "Chain of Thought"-Ansatz verwendet, der komplexe Probleme in kleinere Schritte zerlegt und so bessere Antworten ermöglicht. Derzeit ist eine frühe Vorschau in ChatGPT und der API verfügbar. OpenAI plant, Funktionen wie Web-Browsing und das Hochladen von Dateien und Bildern hinzuzufügen. OpenAI teilte auch mit, dass sie planen, neben der neuen OpenAI o1-Serie auch weiterhin Modelle der GPT-Serie zu entwickeln und herauszubringen. Mit der Weiterentwicklung der KI ebnen Fortschritte wie diese den Weg für leistungsfähigere, intuitivere und vielseitigere KI-Systeme, die menschliche Bedürfnisse besser unterstützen und verstehen können.

Bleiben Sie auf dem neuesten Stand der KI, indem Sie unserer Community beitreten! Besuchen Sie unser GitHub-Repository, um zu sehen, wie wir Pionierarbeit bei KI-Lösungen in Bereichen wie der Fertigung und dem Gesundheitswesen leisten. 🚀

Lassen Sie uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise in die Zukunft des maschinellen Lernens

Kostenloser Start
Link in die Zwischenablage kopiert