Ultralytics YOLO

Wie man den Referenzbereich der Ultralytics YOLO-Dokumentation nutzt

Lerne, wie du den Referenzbereich der Ultralytics YOLO-Dokumentation nutzt, um zu verstehen, was im Hintergrund des Ultralytics Python-Pakets steckt.

ABAbirami Vina4 min readApril 9, 2025

Verwendung des Referenzbereichs der Ultralytics YOLO-Dokumentation

Heutzutage ist künstliche Intelligenz (KI) zugänglicher denn je, was es jedem ermöglicht, einzusteigen und schnell verschiedene KI-Modelle für diverse innovative Aufgaben zu nutzen.

Zum Beispiel ist Computer Vision ein Teilbereich der KI, der es Computern ermöglicht, visuelle Informationen aus Bildern und Videos zu interpretieren und zu verstehen, und Computer-Vision-Modelle wie Ultralytics YOLO11 sind ein einfacher Einstieg.

YOLO11 unterstützt Aufgaben wie Objekterkennung, Instanzsegmentierung und Bildklassifizierung und kann für Anwendungen wie autonomes Fahren, Sicherheitsüberwachung und Einzelhandelsanalyse eingesetzt werden.

YOLO11 erkennt verschiedene Objekte

Abb. 1. YOLO11 kann verwendet werden, um verschiedene Objekte zu erkennen.

Insbesondere bietet das Ultralytics Python-Paket benutzerfreundliche Tools, um diese KI-Modelle schnell zu trainieren, anzupassen und bereitzustellen, sodass Anwender aller Kenntnisstufen problemlos fortschrittliche Computer-Vision-Anwendungen erstellen können.

Wenn du jedoch tiefer in die Funktionsweise eintauchen oder eigene Anpassungen vornehmen möchtest, ist der Referenz-Bereich der Ultralytics-Dokumentation eine großartige Ressource. Er behandelt die internen Abläufe des Ultralytics Python-Pakets, einschließlich der Datenverarbeitung, des Modelltrainingsprozesses und der Visualisierung von Vorhersagen.

In diesem Artikel werfen wir einen genaueren Blick auf den Referenz-Bereich der Ultralytics-Dokumentation und wie du ihn bei der Arbeit an Computer-Vision-Projekten nutzen kannst. Lass uns anfangen!

Link to this sectionEin tieferer Einblick in die Arbeit mit Ultralytics YOLO-Modellen#

Die Arbeit mit dem Ultralytics Python-Paket ist einfach und direkt. Du kannst YOLO-Modelle trainieren oder Objekte in Bildern mit nur wenigen Zeilen Code erkennen.

Sobald du dich jedoch mit Computer-Vision-Modellen vertraut gemacht hast, hilft dir der Referenz-Bereich der Ultralytics-Dokumentation dabei, einen tieferen Einblick zu gewinnen, wie der Code funktioniert und welche Funktionen das Paket unterstützt. Er enthält zudem leicht verständliche Erklärungen, konfigurierbare Optionen und Links zu relevantem Code im Ultralytics GitHub-Repository.

Er erklärt die Struktur des Ultralytics Python-Pakets und behandelt Schlüsselkomponenten wie Modelleinrichtung, Datenladen, den Trainingsprozess sowie die Erstellung und Rückgabe von Vorhersagen.

Alles ist in klare Kategorien unterteilt, sodass du leicht findest, wonach du suchst. Wenn du beispielsweise ein Modell mit deinem eigenen Datensatz trainierst, kannst du den datenbezogenen Teil des Referenz-Bereichs aufrufen, um ein besseres Verständnis dafür zu bekommen, wie deine Daten für das Modelltraining verwendet werden.

Link to this sectionSo startest du mit dem Referenz-Bereich#

Wenn du im Referenz-Bereich der Ultralytics YOLO-Dokumentation bist, findest du auf der linken Seite ein Menü mit verschiedenen Referenzkategorien. Jede Kategorie repräsentiert einen spezifischen Teil der Ultralytics-Codebasis, wie etwa Modelle, Datenverarbeitung oder Trainingsfunktionen.

Ein Klick auf eine Kategorie führt dich zu einer Seite, die dir weitere Details liefert.

Ein Menü mit verschiedenen Referenzkategorien auf der linken Seite der Seite

Abb. 2. Auf der linken Seite findest du ein Menü verschiedener Referenzkategorien.

Ebenso findest du auf der rechten Seite der Seite ein Inhaltsverzeichnis, das jede Referenzseite in Schlüsselkomponenten wie Funktionen (wiederverwendbare Code-Blöcke), Klassen (Vorlagen für die Erstellung von Objekten) und Methoden (in Klassen definierte Funktionen) unterteilt. Dies macht es einfach, direkt zu dem zu springen, was du suchst.

Ein Inhaltsverzeichnis für die Referenzseite auf der rechten Seite

Abb. 3. Auf der rechten Seite findest du ein Inhaltsverzeichnis für die jeweilige Referenzseite, die du gerade betrachtest.

Link to this sectionDie Struktur des Ultralytics GitHub-Repositorys#

Das Ultralytics GitHub-Repository ist in Unterverzeichnisse oder Unterpakete unterteilt, die auf verschiedenen Teilen des Ultralytics-Pakets basieren, wie etwa Modelle, Training und Daten. Der Referenz-Bereich in der Dokumentation folgt genau dieser Struktur, was es einfacher macht zu verstehen, wie alles zusammenpasst.

Hier sind einige der wichtigsten Unterverzeichnisse oder Kategorien, die du sowohl im Ultralytics GitHub-Repository als auch im Referenz-Bereich der Ultralytics-Dokumentation sehen wirst:

Models: Dieser Abschnitt konzentriert sich auf verschiedene Modelle und ihre Modi, wie das Erstellen von Vorhersagen, das Validieren der Leistung und das Exportieren trainierter Modelle.
Engine: Dieser enthält die Kernlogik für das Training, Validieren, Vorhersagen, Exportieren und Evaluieren von Modellen.
Data: Dieser verwaltet, wie Datensätze geladen, verarbeitet und augmentiert werden. Dies umfasst Funktionen zum Erstellen von Dataloadern (Tools, die Daten in Batches in das Modell einspeisen), Anwenden von Transformationen (Änderungen an Bildern wie Größenanpassung oder Spiegelung, um dem Modell beim besseren Lernen zu helfen) und Vorbereiten von Daten (Organisieren und Formatieren der Bilder und Labels) für das Training.
Utils: Dieser Abschnitt bietet eine breite Palette an Hilfsfunktionen, die in der gesamten Codebasis verwendet werden, wie etwa Visualisierungstools, Dateiverwaltung und Metrikberechnungen.
HUB: Dieser verbindet sich mit Ultralytics HUB, einer No-Code-Plattform für Computer Vision, und ermöglicht Cloud-Funktionen wie Einloggen, Hochladen von Modellen und Verwalten von Datensätzen über eine API.
Trackers: Dieser implementiert die Logik zur Objektverfolgung für Anwendungen, die Videos oder Bildsequenzen Bild für Bild verarbeiten.

Jedes dieser Unterverzeichnisse im GitHub-Repository hat einen entsprechenden Abschnitt in der Dokumentation. Diese Struktur wird bewusst gespiegelt, was den Wechsel zwischen dem Lesen der Dokumentation und dem Durchsuchen des Quellcodes erleichtert.

Tatsächlich wird auf vielen Referenzseiten auch der eigentliche Quellcode angezeigt, sodass du genau sehen kannst, wie Funktionen und Klassen implementiert sind, ohne die Dokumentation verlassen zu müssen.

Der Quellcode, der in den Referenzseiten enthalten ist

Abb. 4. Der Quellcode ist ebenfalls auf den Referenzseiten enthalten.

Link to this sectionDie Komponenten Modelle, Engine und Daten verstehen#

Nachdem wir nun gesehen haben, wie der Referenz-Bereich organisiert ist, werfen wir einen genaueren Blick auf drei Schlüsselbereiche des Ultralytics-Pakets: Modelle, Engine und Daten.

Das Unterverzeichnis 'Models' enthält den Code, der definiert, wie jede Art von Modell funktioniert. Es ist sowohl nach Modelltypen (wie YOLO, FastSAM oder RT-DETR) als auch nach Aufgaben wie Erkennung, Segmentierung oder Klassifizierung gegliedert. Innerhalb dieser findest du Dateien oder Module, die spezifische Aktionen behandeln – zum Beispiel, wie das Modell Vorhersagen trifft, wie es trainiert wird oder wie seine Leistung bewertet wird.

Das Unterverzeichnis 'Engine' arbeitet unterdessen hinter den Kulissen, um den gesamten Prozess zu steuern. Während sich das Unterverzeichnis 'Models' darauf konzentriert, was jedes Modell tun soll, konzentriert sich 'Engine' darauf, wie diese Aufgaben konsistent und effizient ausgeführt werden.

Auch das Unterverzeichnis 'Data' ist für das Laden und Vorbereiten von Datensätzen verantwortlich. Dieser Teil der Codebasis stellt sicher, dass deine Trainingsdaten sauber, strukturiert und vielfältig sind, was dem Modell hilft, besser zu lernen und effektiver zu generalisieren.

Diese klare Trennung macht den Code wartungsfreundlicher und bietet Benutzern die Flexibilität, ihn anzupassen.

Link to this sectionBeispiele für die Nutzung des Referenz-Bereichs#

Vielleicht fragst du dich, warum es wichtig ist, die verschiedenen Teile der Ultralytics-Codebasis zu verstehen? Wenn du weißt, welcher Teil des Codes was handhabt, wird es viel einfacher, die benötigten Informationen zu finden, Änderungen vorzunehmen oder Probleme zu beheben.

Hier sind einige Beispiele dafür, wie du den Referenz-Bereich der Dokumentation nutzen kannst:

Wenn du fragst: „Wie macht das Modell Vorhersagen?“, kannst du zur Kategorie 'Models' im Referenz-Bereich gehen, einen Modelltyp auswählen (wie YOLO), eine Aufgabe festlegen (wie detect) und dann die Seite 'Predict' für Details öffnen.
Wenn du wissen möchtest, wie Datenaugmentierungen angewendet werden, kannst du die Seite 'Augment' unter der Kategorie 'Data' erkunden. Sie listet die integrierten Augmentierungstechniken auf, die verwendet werden, um die Modellleistung und die Vielfalt der Trainingsdaten zu verbessern.

Link to this sectionErgebnisse durch den Referenz-Bereich erkunden#

Der Referenz-Bereich ist auch hilfreich, wenn du versuchst, die von deinem Modell zurückgegebenen Ausgaben zu verstehen. Nachdem ein Modell wie YOLO11 verwendet wurde, um eine Inferenz auf einem Bild durchzuführen, gibt es eine Reihe von Ergebnissen zurück, die beschreiben, was erkannt wurde.

In einem Kamera-Feed könnte es zum Beispiel eine Person erkennen und ihren Standort mithilfe einer Bounding Box hervorheben, zusammen mit einem Konfidenzwert – einem Wert zwischen 0 und 1, der angibt, wie sicher sich das Modell bei der Erkennung ist.

Wenn du verstehen möchtest, wie du diese Ausgabe in deinem Projekt verwendest, kann dir der Referenz-Bereich weiterhelfen. Er enthält eine Seite für das Results-Modul, das aufschlüsselt, was enthalten ist und wie du in deinem Code darauf zugreifst. Es gibt Details dazu, wie man Erkennungsboxen anzeigt, Konfidenzwerte überprüft, Ergebnisse darstellt oder sie speichert.

Ein Beispiel dafür, wie von YOLO11 zurückgegebene Ergebnisse visualisiert werden können

Abb. 5. Ein Beispiel dafür, wie Ergebnisse von YOLO11 visualisiert werden können.

Link to this sectionWichtige Erkenntnisse#

Die Ultralytics-Dokumentation hilft dir zu verstehen, wie du YOLO-Modelle effektiv nutzt. Sie erklärt Schlüsselprozesse wie das Training von Modellen, das Vorbereiten von Daten und die Arbeit mit Ergebnissen. Jede Seite bietet klare Erklärungen und beispielhafte Code-Snippets, damit du schnell starten kannst.

Wenn du neugierig bist, was hinter den Kulissen passiert, schlüsselt der Referenz-Bereich der Dokumentation dies Schritt für Schritt auf. Er zeigt, wie der Code strukturiert ist, was jeder Teil macht und wie alles zusammenarbeitet. Das macht es einfacher, zu lernen, anzupassen und selbstbewusst eigene Computer-Vision-Projekte zu bauen.

Werde Teil unserer aktiven Community und erkunde das GitHub-Repository, um mehr über die Entwicklung mit KI zu erfahren. Bereit, deine eigenen Computer-Vision-Ideen zu verwirklichen? Besuche unsere Lizenzoptionen, um loszulegen. Erfahre auf unseren Lösungsseiten, wie Vision AI im Automobilbereich und KI im Gesundheitswesen für Fortschritte sorgen.

Wie man den Referenzbereich der Ultralytics YOLO-Dokumentation nutzt

Link to this sectionEin tieferer Einblick in die Arbeit mit Ultralytics YOLO-Modellen#

Link to this sectionSo startest du mit dem Referenz-Bereich#

Link to this sectionDie Struktur des Ultralytics GitHub-Repositorys#

Link to this sectionDie Komponenten Modelle, Engine und Daten verstehen#

Link to this sectionBeispiele für die Nutzung des Referenz-Bereichs#

Link to this sectionErgebnisse durch den Referenz-Bereich erkunden#

Link to this sectionWichtige Erkenntnisse#

Explore solutions

KI in der Robotik

KI in der Logistik

KI im Einzelhandel

KI im Gesundheitswesen

KI in der Fertigung

KI in der Automobilbranche

KI in der Landwirtschaft

KI in der Robotik

KI in der Logistik

KI im Einzelhandel

KI im Gesundheitswesen

KI in der Fertigung

KI in der Automobilbranche

KI in der Landwirtschaft

KI in der Robotik

KI in der Logistik

KI im Einzelhandel

KI im Gesundheitswesen

KI in der Fertigung

KI in der Automobilbranche

KI in der Landwirtschaft

Lass uns gemeinsam die Zukunft der KI bauen!