Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Vision-KI

Ein Deep Dive in die Fähigkeiten von OpenAIs GPT-4o Mini

Erkunde die Funktionen und Anwendungen von GPT-4o Mini. Das neueste und kosteneffizienteste Modell von OpenAI bietet fortschrittliche KI-Funktionen zu 60 % günstiger als GPT-3.5 Turbo.

ABAbirami Vina
6 min read
OpenAI GPT-4o Mini kosteneffizientes multimodales KI-Modell

Im Mai 2024 veröffentlichte OpenAI GPT-4o, und jetzt, nur drei Monate später, sind sie mit einem weiteren beeindruckenden Modell zurück: GPT-4o Mini. Am 18. Juli 2024 stellte OpenAI GPT-4o Mini vor. Sie bezeichnen es als ihr „kosteneffizientestes Modell“! GPT-4o Mini ist ein kompaktes Modell, das auf den Fähigkeiten früherer Modelle aufbaut und darauf abzielt, fortschrittliche KI zugänglicher und erschwinglicher zu machen.

GPT-4o Mini unterstützt derzeit Text- und Bildinteraktionen, wobei zukünftige Updates voraussichtlich Fähigkeiten zur Verarbeitung von Bildern, Videos und Audio hinzufügen werden. In diesem Artikel untersuchen wir, was GPT-4o Mini ist, seine herausragenden Funktionen, wie es verwendet werden kann, die Unterschiede zwischen GPT-4 und GPT-4o Mini und wie es in verschiedenen Computer-Vision-Anwendungsfällen eingesetzt werden kann. Lass uns eintauchen und sehen, was GPT-4o Mini zu bieten hat!

Link to this sectionWas ist GPT-4o Mini?#

GPT-4o Mini ist die neueste Ergänzung zu OpenAIs Reihe von KI-Modellen, die darauf ausgelegt sind, kosteneffizienter und zugänglicher zu sein. Es handelt sich um ein multimodales Large Language Model (LLM), was bedeutet, dass es verschiedene Arten von Daten wie Text, Bilder, Videos und Audio verarbeiten und generieren kann. Das Modell baut auf den Stärken früherer Modelle wie GPT-4 und GPT-4o auf, um leistungsstarke Funktionen in einem kompakten Paket anzubieten.

GPT-4o Mini ist 60 % günstiger als GPT-3.5 Turbo und kostet 15 Cent pro Million Input-Token (Einheiten von Text oder Daten, die das Modell verarbeitet) und 60 Cent pro Million Output-Token (Einheiten, die das Modell als Antwort generiert). Um das ins Verhältnis zu setzen: Eine Million Token entsprechen in etwa der Verarbeitung von 2.500 Textseiten. Mit einem Kontextfenster von 128K Token und der Fähigkeit, bis zu 16K Output-Token pro Anfrage zu verarbeiten, ist GPT-4o Mini darauf ausgelegt, sowohl effizient als auch erschwinglich zu sein.

GPT-4o Mini ist 60% günstiger als GPT-3.5 Turbo

Abb. 1. GPT-4o Mini ist 60% günstiger als GPT-3.5 Turbo.

Link to this sectionHauptfunktionen von GPT-4o Mini#

GPT-4o Mini unterstützt eine Reihe von Aufgaben, die es zu einer großartigen Option für verschiedene Anwendungen machen. Es kann verwendet werden, wenn mehrere Vorgänge gleichzeitig ausgeführt werden, wie z. B. das Aufrufen mehrerer APIs, der Umgang mit großen Datenmengen wie vollständigen Codebasen oder Gesprächsverläufen sowie die Bereitstellung schneller Echtzeitantworten in Kundensupport-Chatbots.

Hier sind einige weitere Hauptfunktionen:

  • Aktualisierte Wissensbasis: Das Modell enthält Informationen bis Oktober 2023.
  • Verbesserter Tokenizer: GPT-4o Mini macht die Verarbeitung von nicht-englischsprachigem Text kostengünstiger.
  • Robuste Sicherheitsmaßnahmen: Diese Maßnahmen umfassen das Filtern schädlicher Inhalte und den Schutz vor Sicherheitsproblemen wie Prompt-Injections und Systemmanipulationen.

Link to this sectionErste Schritte mit GPT-4o Mini#

Du kannst GPT-4o Mini über die ChatGPT-Benutzeroberfläche ausprobieren. Es ist für Free-, Plus- und Team-Benutzer zugänglich und ersetzt GPT-3.5, wie unten dargestellt. Enterprise-Benutzer erhalten ebenfalls bald Zugriff, ganz im Sinne von OpenAIs Ziel, KI-Vorteile für alle bereitzustellen. GPT-4o Mini ist auch über die API für Entwickler verfügbar, die seine Fähigkeiten in ihre Anwendungen integrieren möchten. Derzeit sind Vision-Fähigkeiten nur über die API zugänglich.

Modelloptionen innerhalb von ChatGPT

Abb. 2. Modelloptionen innerhalb von ChatGPT.

Link to this sectionDer Unterschied zwischen GPT-4o und GPT-4o Mini#

Sowohl GPT-4o Mini als auch GPT-4o erzielen bei verschiedenen Benchmarks beeindruckende Ergebnisse. Während GPT-4o im Allgemeinen besser abschneidet als GPT-4o Mini, ist GPT-4o Mini dennoch eine kostengünstige Lösung für alltägliche Aufgaben. Die Benchmarks umfassen Schlussfolgerungsaufgaben, Mathe- und Programmierkenntnisse sowie multimodales Denken. Wie in der Abbildung unten zu sehen ist, schneidet GPT-4o Mini im Vergleich zu anderen beliebten Modellen sehr gut ab.

Vergleich von GPT-4o Mini mit anderen beliebten Modellen

Abb. 3. Vergleich von GPT-4o Mini mit anderen beliebten Modellen.

Link to this sectionPraktische Erfahrungen mit GPT-4o und GPT-4o Mini#

Ein interessanter Prompt, der online diskutiert wurde, beinhaltet beliebte LLMs, die Dezimalzahlen falsch vergleichen. Als wir GPT-4o und GPT-4o Mini auf die Probe stellten, zeigten ihre Denkfähigkeiten deutliche Unterschiede. In der Abbildung unten haben wir beide Modelle gefragt, was größer ist: 9.11 oder 9.9, und sie dann gebeten, ihre Überlegungen zu erklären.

Testen der Schlussfolgerungsfähigkeit von GPT-4o und GPT-4o Mini

Abb. 4. Testen von GPT-4o und GPT-4o Mini.

Beide Modelle antworten anfangs falsch und behaupten, dass 9.11 größer sei. GPT-4o schafft es jedoch, sich zur richtigen Antwort vorzuarbeiten und stellt fest, dass 9.9 größer ist. Es liefert eine detaillierte Erklärung und vergleicht die Dezimalzahlen korrekt. Im Gegensatz dazu beharrt GPT-4o Mini stur auf seiner ersten falschen Antwort, obwohl es die Überlegung dahinter, warum 9.9 größer ist, eigentlich korrekt herausgefunden hat.

Beide Modelle zeigen starke Denkfähigkeiten. Die Fähigkeit von GPT-4o, sich selbst zu korrigieren, macht es überlegen und nützlich für komplexere Aufgaben. GPT-4o Mini ist zwar weniger anpassungsfähig, bietet aber dennoch klare und genaue Schlussfolgerungen für einfachere Aufgaben.

Link to this sectionVerwendung von GPT-4o Mini für verschiedene Computer-Vision-Anwendungsfälle#

Wenn du die Vision-Fähigkeiten von GPT-4o Mini erkunden möchtest, ohne in den Code einzutauchen, kannst du die API ganz einfach im OpenAI Playground testen. Wir haben es selbst ausprobiert, um zu sehen, wie gut GPT-4o Mini verschiedene computer-vision-bezogene Anwendungsfälle bewältigen kann.

Link to this sectionBildklassifizierung mit GPT-4o Mini#

Wir haben GPT-4o Mini gebeten, zwei Bilder zu klassifizieren: eines von einem Schmetterling und eines von einer Landkarte. Das KI-Modell hat den Schmetterling und die Landkarte erfolgreich identifiziert. Dies ist eine ziemlich einfache Aufgabe, da sich die Bilder stark unterscheiden.

Klassifizierung von Bildern eines Schmetterlings und einer Karte mit GPT-4o Mini

Abb. 5. Klassifizierung von Bildern mit Hilfe von GPT-4o Mini.

Wir haben dann zwei weitere Bilder durch das Modell laufen lassen: eines, das einen Schmetterling zeigt, der auf einer Pflanze ruht, und ein weiteres, das einen Schmetterling zeigt, der auf dem Boden ruht. Die KI hat wieder großartige Arbeit geleistet und den Schmetterling auf der Pflanze sowie denjenigen auf dem Boden korrekt erkannt. Also sind wir noch einen Schritt weiter gegangen.

Klassifizierung ähnlicher Schmetterlingsbilder mit GPT-4o Mini

Abb. 6. Klassifizierung ähnlicher Bilder mit Hilfe von GPT-4o Mini.

Anschließend haben wir GPT-4o Mini gebeten, zwei Bilder zu klassifizieren: eines, das einen Schmetterling zeigt, der sich von den Blüten einer Sumpf-Seidenpflanze ernährt, und das andere, das einen Schmetterling zeigt, der sich von einer Zinnienblüte ernährt. Es ist erstaunlich, dass das Modell in der Lage war, ein Label zu klassifizieren, das so spezifisch ist, ohne weiteres Feintuning. Diese kurzen Beispiele zeigen, dass GPT-4o Mini möglicherweise für Bildklassifizierungsaufgaben verwendet werden könnte, ohne dass ein benutzerdefiniertes Training erforderlich ist.

Klassifizierung detaillierter Schmetterlingsbilder mit GPT-4o Mini

Abb. 7. Klassifizierung detaillierter Bilder mit Hilfe von GPT-4o Mini.

Link to this sectionVerständnis von Posen mittels GPT-4o Mini#

Derzeit können Computer-Vision-Aufgaben wie Objekterkennung und Instanzsegmentierung nicht mit GPT-4o Mini bewältigt werden. GPT-4o hat Schwierigkeiten mit der Genauigkeit, kann aber für solche Aufgaben verwendet werden. In diesem Zusammenhang können wir in Bezug auf das Verständnis von Posen die Pose im Bild zwar nicht erkennen oder schätzen, aber wir können die Pose klassifizieren und verstehen.

Verwendung von GPT-4o Mini zum Verständnis von Posen in einem Bild

Abb. 8. Verwendung von GPT-4o Mini zum Verständnis der Posen in einem Bild.

Das Bild oben zeigt, wie GPT-4o Mini Posen klassifizieren und verstehen kann, obwohl es nicht in der Lage ist, die genauen Koordinaten der Pose zu erkennen oder zu schätzen. Dies kann in verschiedenen Anwendungen hilfreich sein. Zum Beispiel kann es in der Sportanalytik die Bewegungen von Sportlern grob bewerten und helfen, Verletzungen vorzubeugen. Ebenso kann es in der Physiotherapie dabei unterstützen, Übungen zu überwachen, um sicherzustellen, dass die Patienten während der Rehabilitation die korrekten Bewegungen ausführen. Auch bei der Überwachung kann es helfen, verdächtige Aktivitäten zu identifizieren, indem die allgemeine Körpersprache analysiert wird. Während GPT-4o Mini keine spezifischen Schlüsselpunkte erkennen kann, macht seine Fähigkeit, allgemeine Posen zu klassifizieren, es in diesen und anderen Bereichen nützlich.

Link to this sectionAnwendungen, für die sich GPT-4o Mini eignet#

Wir haben uns angesehen, was GPT-4o Mini leisten kann. Lass uns nun die Anwendungen besprechen, bei denen es am sinnvollsten ist, GPT-4o Mini einzusetzen.

GPT-4o Mini eignet sich hervorragend für Anwendungen, die ein fortgeschrittenes Verständnis natürlicher Sprache erfordern und einen geringen Rechenaufwand benötigen. Es ermöglicht die Integration von KI in Anwendungen, für die sie normalerweise zu teuer wäre. Tatsächlich zeigt eine detaillierte Analyse von Artificial Analysis, dass GPT-4o Mini im Vergleich zu den meisten anderen Modellen hochwertige Antworten bei blitzschnellen Geschwindigkeiten liefert.

Qualität im Vergleich zur Ausgabegeschwindigkeit von GPT-4o Mini

Abb. 9. Qualität vs. Output-Geschwindigkeit von GPT-4o Mini.

Hier sind einige Schlüsselbereiche, in denen es in Zukunft glänzen könnte:

  • Virtuelle Assistenten und Chatbots: GPT-4o Mini kann schnelle und intelligente Antworten liefern, um die Benutzerinteraktion zu verbessern.
  • Bildungstools: Das Modell kann verwendet werden, um Tools für personalisiertes Tutoring und die Erstellung von Inhalten zu entwickeln.
  • Produktivitätstools: Es kann Aufgaben verbessern, wie z. B. das Zusammenfassen von Dokumenten, das Entwerfen von E-Mails und das Übersetzen von Sprachen, um die Effizienz zu steigern.
  • Sprachübersetzung: Die neueste Version von GPT kann verwendet werden, um Übersetzer zu entwickeln, die genaue Echtzeit-Sprachübersetzungen für eine bessere Kommunikation in verschiedenen Sprachen bieten.

Link to this sectionGPT-4o Mini öffnet neue Türen#

GPT-4o Mini schafft neue Möglichkeiten für die Zukunft der multimodalen KI. Die Kosten für die Verarbeitung jedes Text- oder Datenstücks, bekannt als Kosten pro Token, sind seit 2022, als text-davinci-003, das GPT-3-Modell, veröffentlicht wurde, erheblich gesunken – um fast 99 %. Der Kostenrückgang zeigt einen klaren Trend hin dazu, fortschrittliche KI erschwinglicher zu machen. Da sich KI-Modelle ständig weiterentwickeln, wird es immer wahrscheinlicher, dass die Integration von KI in jede App und Website wirtschaftlich sinnvoll sein wird!

Möchtest du praktische Erfahrungen mit KI sammeln? Besuche unser GitHub-Repository, um unsere Innovationen zu sehen und Teil unserer aktiven Community zu werden. Erfahre mehr über KI-Anwendungen in der Fertigung und Landwirtschaft auf unseren Lösungsseiten.

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens