Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten

OpenAI o1: Eine neue Serie von OpenAI-Modellen für KI-Reasoning

Abirami Vina

5 Min. Lesezeit

13. September 2024

Finden Sie heraus, was die neu eingeführten OpenAI o1-Modelle besonders macht. Wir werfen auch einen Blick auf ihre Funktionsweise und ihre Auswirkungen auf die Zukunft der KI.

Die KI-Community spekuliert eifrig über den nächsten Schritt für OpenAIs GPT-Modelle, wobei viele ihn als “Project Strawberry” bezeichnen. Der Grund dafür ist, dass GPT-4o Ihnen bei der Frage, wie viele R's im Wort "strawberry" vorkommen, antwortet, dass es zwei R's im Wort "strawberry" gibt. Dies mag angesichts der Leistungsfähigkeit von GPT-4o seltsam erscheinen. Das Modell ist jedoch darauf ausgelegt, den Subtext und nicht die exakten Wörter zu verarbeiten. Es gab Gerüchte, dass das nächste Modell dies beheben soll. Sam Altman befeuerte diese Gerüchte weiter, indem er Bilder von Erdbeeren auf seinem X-Account (ehemals Twitter) veröffentlichte.

Mit der neuesten Ankündigung von OpenAI am Donnerstag, dem 12. September, haben wir endlich eine Antwort auf die Spekulationen! OpenAI o1, eine neue Serie von KI-Modellen, die entwickelt wurden, um vor der Antwort innezuhalten und nachzudenken, wurde veröffentlicht. Interessanterweise kann OpenAI o1 besser argumentieren und die Frage nach den Erdbeeren korrekt beantworten! In diesem Artikel werden wir erörtern, was OpenAI o1 ist, wie es funktioniert, wo es eingesetzt werden kann und was es für die Zukunft der KI bedeutet. Fangen wir an!

__wf_reserved_inherit
Abb. 1. Ein Beispiel für die Abfrage von OpenAI o1 zu Erdbeeren.

Neue Fortschritte in der KI durch OpenAI

Im Juli 2024 teilten Führungskräfte von OpenAI mit, dass die Forschung von OpenAI sich einem menschlichen Niveau der Problemlösung nähert, das als Level 2 der KI bezeichnet wird. Es ist klar, dass sich dieses Level auf das Reasoning konzentriert, da OpenAI seine neue Modellreihe OpenAI o1 als "Denken vor der Antwort" vorstellt. OpenAI o1 ist ein neues LLM (Large Language Model), ein KI-Modell, das menschenähnlichen Text versteht und generiert, indem es Muster aus riesigen Mengen an Sprachdaten lernt. Es wurde entwickelt, um komplexe Probleme zu bewältigen, die ein tiefes Reasoning erfordern. 

__wf_reserved_inherit
Abb. 2. OpenAIs Perspektive auf die Stadien der KI.

Das Modell wurde mithilfe von Reinforcement Learning trainiert, einer Technik, bei der das Modell durch Versuch und Irrtum lernt, bessere Entscheidungen zu treffen, indem es für seine Aktionen Belohnungen oder Strafen erhält. Der Reinforcement-Learning-Algorithmus hilft dem Modell, effektiver zu denken, indem es einer Gedankenkette folgt. OpenAI teilte außerdem mit, dass sich die Performance von o1 durch mehr Reinforcement Learning während des Trainings und durch mehr Zeit, die es mit "Denken" während der Problemlösung verbringt, immer weiter verbessert, was zeigt, dass sowohl ein erweitertes Training als auch eine durchdachte Verarbeitung die Fähigkeiten des Modells verbessern.

Obwohl OpenAI o1 ein bedeutender Fortschritt für komplexes Reasoning ist, handelt es sich noch um ein frühes Modell, dem einige Funktionen fehlen, die ChatGPT nützlich machen, wie z. B. das Surfen im Internet oder das Hochladen von Dateien und Bildern. Für viele gängige Aufgaben ist GPT-4o im Moment möglicherweise noch besser geeignet. OpenAI o1 markiert jedoch einen großen Schritt nach vorn in der Fähigkeit der KI, komplexes Reasoning zu bewältigen, weshalb OpenAI eine neue Serie startet und sie OpenAI o1 nennt.

Wie die neuen OpenAI-Modelle das KI-Reasoning verbessern

OpenAI o1 kann für Aufgaben wie das Entschlüsseln von Chiffren, das Lösen von Programmieraufgaben, das Beantworten von mathematischen Problemen, das Bearbeiten von Kreuzworträtseln und sogar für komplexe Themen in den Bereichen Wissenschaft, Sicherheit und Gesundheitswesen eingesetzt werden. In einer amüsanten Anspielung auf den Codenamen des Projekts demonstrierte OpenAI die Denkfähigkeiten des Modells, indem es eine Chiffre knackte, die die Nachricht "THERE ARE THREE R’S IN STRAWBERRY" enthüllte. 

Neben dem Lösen von Chiffren ist OpenAI o1 auch im Programmieren versiert. Es schneidet gut bei Wettbewerbs-Programmieraufgaben ab, wie sie auf Codeforces zu finden sind, einer Plattform, auf der Programmierer unter Zeitdruck komplexe Programmierprobleme lösen. Bei diesen Herausforderungen erreicht das Modell hohe Elo-Bewertungen (ein Bewertungssystem, das das Fähigkeitsniveau auf der Grundlage der Leistung gegenüber anderen Wettbewerbern misst) und übertrifft frühere Modelle. Es zeichnet sich auch in Mathematik aus und schneidet bei Prüfungen wie der American Invitational Mathematics Examination (AIME) gut ab. 

__wf_reserved_inherit
Abb. 3. Benchmarking der Programmierfähigkeiten von o1.

Diese Fortschritte positionieren OpenAI o1 als ein deutliches Upgrade gegenüber früheren Modellen wie GPT-4o. Es eröffnet neue Möglichkeiten für KI in Bereichen wie Wirtschaft, Entwicklung, Forschung und Gesundheitswesen. In der Genetikforschung kann OpenAI o1 beispielsweise schnell eine große Anzahl von Forschungsarbeiten durchgehen und wichtige Erkenntnisse und Verbindungen zwischen genetischen Markern und Krankheiten herausfiltern. Es versteht komplexe wissenschaftliche Sprache und kann wichtige Punkte zusammenfassen, wodurch Forschern geholfen wird, sich auf die relevantesten Informationen zu konzentrieren. 

Ein genauerer Blick auf die Gedankenkette

Wir haben bereits gesehen, dass OpenAI o1 einen "Chain of Thought"-Denkprozess einführt. Er ermöglicht es dem Modell, komplexe Probleme auf eine Weise anzugehen, die menschlichen kognitiven Strategien ähnlich ist. Das Modell kann Herausforderungen in kleinere, besser handhabbare Schritte unterteilen und seinen Ansatz iterativ verfeinern. Im Gegensatz zu früheren Modellen, die sich auf die unmittelbare Mustererkennung verlassen haben, optimiert o1 seine Entscheidungsfindung, indem es mehrere Denkpfade untersucht und durch verstärkendes Lernen sowohl aus Erfolgen als auch aus Fehlern lernt.

OpenAI hat beschlossen, diese rohen Gedankenkette vor den Nutzern verborgen zu halten und stattdessen Zusammenfassungen anzubieten, die Einblicke in die Denkweise des Modells geben, ohne jeden Schritt offenzulegen. Diese Entscheidung hilft, den Missbrauch des Denkprozesses des Modells zu verhindern und ermöglicht es Entwicklern dennoch, die Sicherheit und Ausrichtung der KI zu überwachen und zu verfeinern. Durch die interne Beobachtung der verborgenen Ketten können Entwickler sicherstellen, dass o1 ethische Richtlinien einhält und schädliches Verhalten vermeidet.

Benchmarking von OpenAI o1

OpenAI o1 zeigt deutliche Verbesserungen gegenüber GPT-4o in verschiedenen Benchmarks, die die Fähigkeiten zum logischen Denken und zur Problemlösung testen. Bei der American Invitational Mathematics Examination (AIME) 2024, einer anspruchsvollen Mathematikprüfung für die besten Gymnasiasten, erreichte o1 eine Genauigkeit von 74 % mit nur einem Sample pro Aufgabe, verglichen mit 12 % bei GPT-4o. Mit einem Konsens über 64 Samples stieg die Genauigkeit auf 83 %, und durch die Verwendung einer verfeinerten Re-Ranking-Methode mit 1.000 Samples erreichte sie 93 %, was es unter die besten 500 Schüler des Landes brachte. 

Neben der Mathematik schnitt o1 auch bei Benchmarks, die wissenschaftliches Wissen testen, wie dem GPQA Diamond, der Fragen auf PhD-Niveau in Chemie, Physik und Biologie abdeckt, außergewöhnlich gut ab. Bemerkenswerterweise übertraf o1 bei diesem Test menschliche Experten mit Doktortitel und ist damit das erste KI-Modell, dem dies gelang. Es übertraf GPT-4o auch in 54 von 57 Kategorien im MMLU-Benchmark, der das Verständnis in einer Vielzahl von Fächern testet, darunter Geschichte, Recht und Wissenschaft.

__wf_reserved_inherit
Abb. 4. Benchmarking von OpenAI o1.

Machen Sie sich mit OpenAI o1 vertraut

OpenAI hat zwei neue KI-Modelle in der o1-Serie vorgestellt: o1-preview und o1-mini. Das o1-preview-Modell ist so konzipiert, dass es vor der Antwort gründlicher nachdenkt und sich bei komplexen Denkaufgaben in den Bereichen Wissenschaft, Programmierung und Mathematik auszeichnet. Es bietet fortschrittliche Problemlösungsfunktionen für Benutzer, die anspruchsvolle Projekte bearbeiten. Im Gegensatz dazu ist o1-mini ein kleineres, schnelleres und kostengünstigeres Modell, das speziell für STEM-Denkprozesse, insbesondere Mathematik und Programmierung, optimiert wurde. Während es weniger umfassendes Weltwissen haben mag, erreicht o1-mini fast die gleiche Leistung wie o1-preview bei Schlüsselbewertungen wie dem AIME-Mathematikwettbewerb und den Codeforces-Programmieraufgaben, und das bei 80 % geringeren Kosten.

__wf_reserved_inherit
Abb. 5. Vergleich von OpenAI-Modellen.

Sie können diese Modelle über verschiedene OpenAI-Plattformen ausprobieren. ChatGPT Plus- und Team-Benutzer können sowohl auf o1-preview als auch auf o1-mini über die Modellauswahl zugreifen und die erweiterten Denkfähigkeiten direkt in ChatGPT erleben. Entwickler mit API-Nutzungsstufe 5 können mit der Prototypenerstellung mit diesen Modellen beginnen, obwohl einige erweiterte Funktionen noch in der Entwicklung sind. OpenAI plant außerdem, o1-mini bald allen ChatGPT Free-Benutzern zur Verfügung zu stellen. Indem Sie diese Modelle erkunden, können Sie die Fortschritte im Bereich des KI-Denkens aus erster Hand erleben und das Modell auswählen, das Ihren Bedürfnissen am besten entspricht.

Ethische KI-Erwägungen von OpenAI

OpenAI hat sich bei der Entwicklung der o1-Modellreihe auf Ethik und Sicherheit konzentriert. Vor der Veröffentlichung der Modelle o1-preview und o1-mini führten sie gründliche Bewertungen durch, einschließlich externer Tests und interner Kontrollen auf Risiken wie unzulässige Inhalte, Halluzinationen und Verzerrungen. Die Modelle sind mit fortschrittlichen Denkfähigkeiten ausgestattet, um Sicherheitsregeln besser zu verstehen und zu befolgen. 

OpenAI hat auch Schutzmaßnahmen wie Sperrlisten und Sicherheitsklassifikatoren implementiert, um Risiken zu managen. Das o1-Modell hat eine mittlere Gesamtrisikobewertung. Es hat geringe Risiken in Bereichen wie Cybersicherheit und Modellautonomie sowie mittlere Risiken in Bereichen wie CBRN-Inhalte (chemische, biologische, radiologische und nukleare Inhalte) und Überzeugung. Die Sicherheitsberatungsgruppe und der Vorstand von OpenAI haben diese Sicherheitsmaßnahmen überprüft, um sicherzustellen, dass das Modell sicher und ethisch einwandfrei zu verwenden ist.

__wf_reserved_inherit
Abb. 6. OpenAI o1 Scorecard.

Von Gerüchten zur Realität: OpenAI o1 betritt die Bühne

OpenAI o1 ist ein großer Schritt nach vorn im Bereich des KI-Denkens und setzt einige der frühen Gerüchte in die Realität um. Im Gegensatz zu GPT-4o denkt die o1-Serie gründlicher nach, indem sie einen "Chain of Thought"-Ansatz verwendet und komplexe Probleme in kleinere Schritte unterteilt, um bessere Antworten zu erhalten. OpenAI plant, die derzeit als frühe Vorschau in ChatGPT und der API verfügbare Version um Funktionen wie Web-Browsing sowie Datei- und Bild-Uploads zu erweitern. OpenAI teilte außerdem mit, dass sie planen, weiterhin Modelle der GPT-Serie sowie die neue OpenAI o1-Serie zu entwickeln und zu veröffentlichen. Da sich KI ständig weiterentwickelt, ebnen Fortschritte wie diese den Weg für leistungsfähigere, intuitivere und vielseitigere KI-Systeme, die menschliche Bedürfnisse besser unterstützen und verstehen können.

Bleiben Sie auf dem Laufenden mit den neuesten Entwicklungen im Bereich der KI, indem Sie unserer Community beitreten! Besuchen Sie unser GitHub-Repository, um zu sehen, wie wir KI-Lösungen in Sektoren wie Fertigung und Gesundheitswesen entwickeln. 🚀

Lasst uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise mit der Zukunft des maschinellen Lernens

Kostenlos starten
Link in die Zwischenablage kopiert