So nutzt du den Referenzbereich der Ultralytics YOLO Docs
Erfahre, wie du den Referenzbereich der Ultralytics YOLO Docs nutzt, um zu verstehen, was im Hintergrund des Ultralytics Python-Pakets abläuft.

Heutzutage ist künstliche Intelligenz (KI) zugänglicher als je zuvor, sodass jeder direkt einsteigen und schnell damit beginnen kann, verschiedene KI-Modelle für diverse moderne Aufgaben zu nutzen.
Zum Beispiel ist Computer Vision ein Teilbereich der KI, der es Computern ermöglicht, visuelle Informationen aus Bildern und Videos zu interpretieren und zu verstehen. Mit Computer-Vision-Modellen wie Ultralytics YOLO11 ist der Einstieg ganz einfach.
YOLO11 unterstützt Aufgaben wie Objekterkennung, Instanzsegmentierung und Bildklassifizierung und kann für Anwendungen wie autonomes Fahren, Sicherheitsüberwachung und Einzelhandelsanalysen eingesetzt werden.

Abb. 1. YOLO11 kann zur Erkennung verschiedener Objekte verwendet werden.
Insbesondere das Ultralytics Python-Paket bietet benutzerfreundliche Tools zum schnellen Trainieren, Anpassen und Bereitstellen dieser KI-Modelle, wodurch Benutzer aller Kenntnisstufen problemlos fortschrittliche Computer-Vision-Anwendungen erstellen können.
Wenn du jedoch tiefer in die Funktionsweise eintauchen oder eigene Anpassungen vornehmen möchtest, ist der Referenzbereich der Ultralytics-Dokumentation eine großartige Ressource. Er behandelt die internen Abläufe des Ultralytics Python-Pakets, einschließlich der Datenverarbeitung, des Modelltrainingsprozesses und der Visualisierung von Vorhersagen.
In diesem Artikel werfen wir einen genaueren Blick auf den Referenzbereich der Ultralytics-Dokumentation und darauf, wie du ihn bei der Arbeit an Computer-Vision-Projekten nutzt. Fangen wir an!
Link to this sectionEin tieferer Einblick in die Arbeit mit Ultralytics YOLO Modellen#
Die Arbeit mit dem Ultralytics Python-Paket ist einfach und direkt. Du kannst YOLO-Modelle trainieren oder Objekte erkennen in Bildern mit nur wenigen Codezeilen.
Sobald du dich jedoch mit Computer-Vision-Modellen vertraut gemacht hast, hilft dir der Referenzbereich der Ultralytics-Dokumentation dabei, tiefer in die Funktionsweise des Codes einzutauchen und zu verstehen, welche Funktionen das Paket unterstützt. Er enthält zudem leicht verständliche Erklärungen, konfigurierbare Optionen und Links zu relevantem Code im Ultralytics GitHub-Repository.
Er erklärt die Struktur des Ultralytics Python-Pakets und deckt Schlüsselkomponenten wie Modelleinrichtung, Datenladen, den Trainingsprozess sowie die Erstellung und Rückgabe von Vorhersagen ab.
Alles ist in klare Kategorien unterteilt, sodass du leicht findest, was du suchst. Wenn du zum Beispiel ein Modell mit deinem eigenen Datensatz trainierst, kannst du den datenbezogenen Teil des Referenzbereichs aufrufen, um ein besseres Verständnis dafür zu erhalten, wie deine Daten für das Modelltraining verwendet werden.
Link to this sectionSo steigst du in den Referenzbereich ein#
Wenn du den Referenzbereich in der Ultralytics YOLO-Dokumentation aufrufst, findest du auf der linken Seite ein Menü mit verschiedenen Referenzkategorien. Jede Kategorie repräsentiert einen spezifischen Teil der Ultralytics-Codebasis, wie z. B. Modelle, Datenverarbeitung oder Trainingsfunktionen.
Durch Klicken auf eine Kategorie gelangst du zu einer Seite mit weiteren Details.

Abb. 2. Auf der linken Seite findest du ein Menü mit verschiedenen Referenzkategorien.
Ebenso findest du auf der rechten Seite der Seite das Inhaltsverzeichnis, das jede Referenzseite in Schlüsselkomponenten wie Funktionen (wiederverwendbare Codeblöcke), Klassen (Vorlagen für die Erstellung von Objekten) und Methoden (in Klassen definierte Funktionen) unterteilt. So kannst du direkt zu dem springen, was du suchst.

Abb. 3. Auf der rechten Seite findest du ein Inhaltsverzeichnis für die spezifische Referenzseite, die du gerade ansiehst.
Link to this sectionDie Struktur des Ultralytics GitHub-Repository#
Das Ultralytics GitHub-Repository ist in Unterverzeichnisse oder Unterpakete unterteilt, die auf verschiedenen Teilen des Ultralytics-Pakets basieren, wie z. B. Modelle, Training und Daten. Der Referenzbereich in der Dokumentation folgt derselben Struktur, was es einfacher macht zu verstehen, wie alles zusammenhängt.
Hier sind einige der wichtigsten Unterverzeichnisse oder Kategorien, die du sowohl im Ultralytics GitHub-Repository als auch im Referenzbereich der Ultralytics-Dokumentation findest:
- Modelle: Dieser Bereich konzentriert sich auf verschiedene Modelle und deren Modi, wie z. B. das Erstellen von Vorhersagen, das Validieren der Leistung und das Exportieren trainierter Modelle.
- Engine: Sie enthält die Kernlogik für das Training, die Validierung, die Vorhersage, den Export und die Bewertung von Modellen.
- Daten: Dieser Bereich verwaltet das Laden, Verarbeiten und Augmentieren von Datensätzen. Dazu gehören Funktionen zum Erstellen von Dataloadern (Tools, die Daten in Batches in das Modell einspeisen), zum Anwenden von Transformationen (Änderungen an Bildern wie Größenanpassung oder Spiegelung, um das Lernen des Modells zu verbessern) und zur Vorbereitung von Daten (Organisieren und Formatieren von Bildern und Labels) für das Training.
- Utils: Dieser Bereich bietet eine breite Palette an Hilfsfunktionen, die in der gesamten Codebasis verwendet werden, wie z. B. Visualisierungstools, Dateiverarbeitung und Metrikberechnungen.
- HUB: Er stellt die Verbindung zum Ultralytics HUB her, einer No-Code-Plattform für Computer Vision, und ermöglicht Cloud-Funktionen wie Anmeldung, Hochladen von Modellen und Verwaltung von Datensätzen über eine API.
- Tracker: Implementiert die Logik zur Objektverfolgung für Anwendungen mit Videos oder Bildsequenzen.
Jedes dieser Unterverzeichnisse im GitHub-Repository hat einen entsprechenden Abschnitt in der Dokumentation. Diese Struktur wird bewusst gespiegelt, was den Wechsel zwischen dem Lesen der Dokumentation und dem Erkunden des Quellcodes erleichtert.
Tatsächlich wird auf vielen Referenzseiten auch der eigentliche Quellcode angezeigt, sodass du genau sehen kannst, wie Funktionen und Klassen implementiert sind, ohne die Dokumentation zu verlassen.

Abb. 4. Der Quellcode ist ebenfalls auf den Referenzseiten enthalten.
Link to this sectionVerständnis der Komponenten Modelle, Engine und Daten#
Nachdem wir nun gesehen haben, wie der Referenzbereich aufgebaut ist, werfen wir einen genaueren Blick auf drei wichtige Teile des Ultralytics-Pakets: Modelle, Engine und Daten.
Das Unterverzeichnis für Modelle enthält den Code, der definiert, wie die einzelnen Modelltypen funktionieren. Es ist sowohl nach Modelltypen (wie YOLO, FastSAM oder RT-DETR) als auch nach Aufgaben wie Erkennung, Segmentierung oder Klassifizierung gegliedert. In jedem dieser Bereiche findest du Dateien oder Module, die spezifische Aktionen abwickeln – zum Beispiel, wie das Modell Vorhersagen trifft, wie es trainiert wird oder wie seine Leistung bewertet wird.
Das Unterverzeichnis für die Engine arbeitet unterdessen im Hintergrund, um den gesamten Prozess zu verwalten. Während sich das Unterverzeichnis für Modelle darauf konzentriert, was jedes Modell tun soll, konzentriert sich die Engine darauf, wie diese Aufgaben konsistent und effizient ausgeführt werden.
Das Unterverzeichnis für Daten ist zudem für das Laden und Vorbereiten von Datensätzen verantwortlich. Dieser Teil der Codebasis stellt sicher, dass deine Trainingsdaten sauber, strukturiert und vielfältig sind, was dem Modell hilft, besser zu lernen und effektiver zu generalisieren.
Diese klare Trennung macht den Code wartungsfreundlicher und bietet Benutzern die Flexibilität, ihn anzupassen.
Link to this sectionBeispiele für die Nutzung des Referenzbereichs#
Du fragst dich vielleicht, warum es wichtig ist, die verschiedenen Teile der Ultralytics-Codebasis zu verstehen? Wenn du weißt, welcher Teil des Codes was übernimmt, wird es viel einfacher, die benötigten Informationen zu finden, Änderungen vorzunehmen oder Probleme zu beheben.
Hier sind einige Beispiele, wie du den Referenzbereich der Dokumentation nutzen kannst:
- Wenn du wissen möchtest: „Wie trifft das Modell Vorhersagen?“, kannst du im Referenzbereich zur Kategorie „Modelle“ gehen, einen Modelltyp (wie YOLO) auswählen, eine Aufgabe (wie Erkennung) wählen und dann die „Predict“-Seite für Details öffnen.
- Wenn du wissen möchtest, wie Datenaugmentation angewendet wird, kannst du die „Augment“-Seite unter der Kategorie „Daten“ erkunden. Sie listet die integrierten Augmentierungstechniken auf, die verwendet werden, um die Modellleistung und die Vielfalt der Trainingsdaten zu verbessern.
Link to this sectionErgebnisse durch den Referenzbereich erkunden#
Der Referenzbereich ist auch hilfreich, wenn du versuchst, die von deinem Modell zurückgegebenen Ausgaben zu verstehen. Nachdem ein Modell wie YOLO11 für die Inferenz auf einem Bild verwendet wurde, gibt es eine Reihe von Ergebnissen zurück, die beschreiben, was erkannt wurde.
In einem Kamerastream könnte es beispielsweise eine Person erkennen und ihren Standort mithilfe einer Bounding Box hervorheben, zusammen mit einem Konfidenzwert – einem Wert zwischen 0 und 1, der angibt, wie sicher sich das Modell bei der Erkennung ist.
Wenn du verstehen möchtest, wie du diese Ausgabe in deinem Projekt verwendest, kann dir der Referenzbereich helfen. Er enthält eine Seite für das Results-Modul, die aufschlüsselt, was enthalten ist und wie du in deinem Code darauf zugreifen kannst. Es gibt Details dazu, wie man Erkennungsboxen anzeigt, Konfidenzwerte prüft, Ergebnisse darstellt oder speichert.

Abb. 5. Ein Beispiel dafür, wie die von YOLO11 zurückgegebenen Ergebnisse visualisiert werden können.
Link to this sectionWichtige Erkenntnisse#
Die Ultralytics-Dokumentation hilft dir dabei, YOLO-Modelle effektiv zu nutzen. Sie erklärt Schlüsselprozesse wie das Training von Modellen, die Vorbereitung von Daten und die Arbeit mit Ergebnissen. Jede Seite enthält klare Erklärungen und Beispiel-Code-Snippets, damit du schnell loslegen kannst.
Wenn du neugierig darauf bist, was hinter den Kulissen passiert, schlüsselt der Referenzbereich der Dokumentation dies ebenfalls Schritt für Schritt auf. Er zeigt, wie der Code strukturiert ist, was jeder Teil tut und wie alles zusammenarbeitet. Dies macht es einfacher, zu lernen, anzupassen und selbstbewusst eigene Computer-Vision-Projekte aufzubauen.
Werde Teil unserer aktiven Community und erkunde das GitHub-Repository, um mehr über das Bauen mit KI zu erfahren. Bereit, deine eigenen Computer-Vision-Ideen umzusetzen? Besuche unsere Lizenzoptionen, um loszulegen. Sieh dir auf unseren Lösungsseiten an, wie Vision AI in der Automobilbranche und KI im Gesundheitswesen einen Einfluss haben.






