Erfahren Sie, wie Sie YOLO mit Ultralytics schneller trainieren können – einer End-to-End-Umgebung, die entwickelt wurde, um den Weg von den Daten bis zur Bereitstellung zu beschleunigen.
Erfahren Sie, wie Sie YOLO mit Ultralytics schneller trainieren können – einer End-to-End-Umgebung, die entwickelt wurde, um den Weg von den Daten bis zur Bereitstellung zu beschleunigen.
Letzte Woche Ultralytics die Ultralytics Ultralytics , eine einheitliche Arbeitsumgebung, die darauf ausgelegt ist, die Entwicklung, das Training und die Bereitstellung von Computer-Vision-Modellen für Teams zu vereinfachen. Anstatt mit mehreren Tools jonglieren zu müssen, vereint die Plattform alles an einem Ort. So wird der Weg von der Idee bis zur Bereitstellung von Vision-KI-Modellen zum Kinderspiel.
Dies ist von entscheidender Bedeutung, da Computer Vision sich rasch zu einem zentralen Bestandteil verschiedener Branchen entwickelt. Es bildet die Grundlage für Anwendungen wie die Fertigungsprüfung, Analysen im Einzelhandel und autonome Navigation.
Ob diese bildverarbeitungsgestützten Anwendungen zu zuverlässigen Systemen werden, hängt davon ab, wie gut die Modelle trainiert sind. Beim Modelltraining wird anhand von beschrifteten Daten gelernt, damit das Modell Muster erkennen und genaue Vorhersagen treffen kann. Im Allgemeinen führen gut trainierte Modelle zu einer besseren Modellleistung und zuverlässigeren Ergebnissen in praktischen Anwendungen.
Das Trainieren eines Computer-Vision-Modells ist jedoch nicht immer einfach. Es umfasst verschiedene Aspekte, wie beispielsweise die Einrichtung von Umgebungen, die Auswahl geeigneter Rechenressourcen, die Optimierung von Hyperparametern und die Verfolgung mehrerer Trainingsexperimente. Wenn diese Schritte auf verschiedene Tools und Systeme verteilt sind, wird der Trainingsworkflow schnell komplex und schwer zu verwalten.
Die Ultralytics löst dieses Problem, indem sie den gesamten Trainingsprozess in einem einzigen, einheitlichen Dashboard zusammenführt. Sie können Trainingsaufträge an einem Ort konfigurieren, ausführen und überwachen, ganz gleich, ob Sie in der Cloud, lokal oder auf Google arbeiten.

In diesem Artikel erfahren Sie, wie Ultralytics das Modelltraining optimiert und warum sie Ihnen bei Ihren Vision-AI-Projekten einen Wettbewerbsvorteil verschaffen kann. Los geht’s!
Bevor wir uns damit befassen, wie das Modelltraining auf Ultralytics funktioniert, wollen wir zunächst einen Schritt zurücktreten und uns ansehen, was Modelltraining eigentlich ist und was dazu gehört.
Das Modelltraining ist der Prozess, durch den ein Computer-Vision-Modell lernt, visuelle Daten zu interpretieren. Es analysiert Bilder oder Videos und passt seine internen Parameter schrittweise an, um Bildverarbeitungsaufgaben wie Objekterkennung, Bildklassifizierung und Instanzsegmentierung präzise auszuführen. Im Laufe der Zeit verbessert sich das Modell, indem es Muster direkt aus den Daten lernt, die es sieht.
Die Qualität des Trainings hängt stark von den Datensätzen ab. Man kann sich einen Datensatz wie einen Satz Lernkarten vorstellen, die ein Lehrer zum Unterrichten eines Schülers verwenden würde, wobei jedes Beispiel dem Modell hilft zu lernen, worauf es achten muss.
Ein typischer Datensatz für Computer Vision umfasst Bilder, meist in Formaten wie JPG oder PNG, sowie Anmerkungen, die beschreiben, was auf den einzelnen Bildern zu sehen ist. Diese Anmerkungen, die oft als JSON- oder TXT-Dateien gespeichert sind, liefern die Beschriftungen und den Kontext, die das Modell benötigt, um effektiv zu lernen.
Beim Training geht es jedoch nicht nur darum, Daten in ein Modell einzuspeisen. Es umfasst mehrere wichtige Schritte, von der Aufbereitung des Datensatzes über die Auswahl des richtigen Modells bis hin zur Konfiguration des Trainingsprozesses. Sehen wir uns nun einige dieser Schritte genauer an.
Man könnte meinen, dass man, sobald man einen Datensatz hat, sofort mit dem Training eines Modells beginnen kann, doch es gibt einige Schritte, die man zuvor durchführen muss, wie zum Beispiel die Aufteilung des Datensatzes.
Im Allgemeinen wird ein Datensatz in drei Teile aufgeteilt: Trainingssatz, Validierungssatz und Testsatz. Die Trainingsbilder dienen dazu, dem Modell Muster in den Daten beizubringen, während der Validierungssatz dabei hilft, die Leistung während des Trainings zu überwachen und zu optimieren.
Der Testdatensatz wird am Ende verwendet, um zu bewerten, wie gut das Modell bei völlig neuen, bisher unbekannten Daten abschneidet. Dieser Ansatz trägt dazu bei, sicherzustellen, dass das Modell die Daten nicht nur auswendig lernt, sondern auch auf reale Szenarien übertragen kann.
Ein weiterer wichtiger Schritt vor dem Training ist die Auswahl des Modells, das Sie verwenden möchten. In vielen Fällen bedeutet dies, ein vortrainiertes Modell auszuwählen. Modelle wieYOLO Ultralytics wurden bereits anhand großer Datensätze trainiert und haben allgemeine visuelle Muster gelernt, was sie zu einem soliden Ausgangspunkt macht.
Die Verwendung dieser Modelle ist ein Beispiel für Transferlernen, bei dem man auf vorhandenem Wissen aufbaut und das Modell an die jeweilige Aufgabe anpasst. Dieser Ansatz trägt dazu bei, das Training zu beschleunigen und die Ergebnisse zu verbessern, insbesondere bei der Arbeit mit begrenzten Datenmengen.
Diese Modelle sind zudem in verschiedenen Größen erhältlich, wobei jede Größe einen Kompromiss zwischen Geschwindigkeit und Genauigkeit darstellt. Kleinere Modelle sind schneller und effizienter, während größere Modelle in der Regel eine höhere Genauigkeit bieten, aber mehr Rechenleistung erfordern.
Sobald Sie über einen vorbereiteten Datensatz verfügen und ein Modell ausgewählt haben, besteht der nächste Schritt darin, festzulegen, wie das Modell trainiert wird.
Ein Computer-Vision-Modell wird anhand einer Reihe von Parametern trainiert, die festlegen, wie es Daten verarbeitet, seine Gewichte aktualisiert und sich im Laufe der Zeit verbessert. Diese Einstellungen wirken sich unmittelbar sowohl auf die Trainingsgeschwindigkeit als auch auf die endgültige Genauigkeit aus und sind daher für das Erreichen überzeugender Ergebnisse von entscheidender Bedeutung.
Hier sind einige der am häufigsten verwendeten Trainingsparameter:
In denYOLO Workflows Ultralytics werden diese Konfigurationen in der Regel in einer YAML-Datei definiert. Diese Datei enthält Angaben zu den Pfaden der Datensätze, den Klassennamen und der Aufteilung der Daten. Sie dient als zentrale Konfiguration, die dem Modell vorgibt, wie der Datensatz zu interpretieren ist.
Wir haben soeben einige der wichtigsten Schritte beim Trainieren eines Computer-Vision-Modells besprochen, von der Vorbereitung der Datensätze über die Auswahl eines Modells bis hin zur Konfiguration der Trainingsparameter. In der Praxis geht der Prozess oft noch weiter und umfasst auch Nachverfolgungsexperimente, den Vergleich mehrerer Trainingsdurchläufe und die kontinuierliche Verfeinerung der Modelle im Laufe der Zeit.
Diese Schritte werden selten an einem einzigen Ort abgewickelt. Datensätze werden möglicherweise in einem Tool aufbereitet, Trainingsläufe in einer anderen Umgebung durchgeführt und die Nachverfolgung von Experimenten separat verwaltet. Wenn Projekte wachsen, führt diese Fragmentierung zu mehr Komplexität, verlangsamt die Iterationszyklen und erschwert es, den Überblick zu behalten.
Ultralytics beseitigt diese Komplexität, indem sie den gesamten Trainingsworkflow in einer einzigen Umgebung zusammenführt. Anstatt zwischen verschiedenen Tools hin- und herzuwechseln, können Sie Datensätze verwalten, das Training konfigurieren, Experimente durchführen und die Ergebnisse an einem einzigen Ort überwachen.
Als Nächstes wollen wir uns damit befassen, wie Ultralytics das Modelltraining optimiert.
In der Praxis erfordert das Trainieren eines Computer-Vision-Modells oft flexible Umgebungen. Je nach Größe Ihres Datensatzes, der Komplexität des Modells und der verfügbaren Hardware können Sie das Training in der Cloud, auf einem lokalen Rechner oder über externe Notebook-Umgebungen durchführen.
Ultralytics unterstützt die folgenden Schulungsoptionen, um diesen Anforderungen gerecht zu werden:
Bei Projekten im Bereich Computer Vision ist es nicht immer einfach, Modelle lokal oder in Notebook-Umgebungen zu trainieren.
Beim lokalen Training hängt die Leistung beispielsweise vollständig von Ihrer Hardware ab, was die Rechenleistung einschränken und Experimente verlangsamen kann. GPUs sind für ein effizientes Training unerlässlich, doch nicht jede Umgebung verfügt über einen zuverlässigen Zugang zu ihnen.
Zwar bieten Notebook-Umgebungen wie Google mit ihren cloudbasierten GPUs eine Alternative, doch sind die Sitzungen oft nur vorübergehend und können längere Trainingsläufe unterbrechen. Da die Datensätze immer größer und die Arbeitsabläufe immer komplexer werden, können diese Einschränkungen schnell zu Engpässen führen, wodurch das Training langsamer und weniger zuverlässig wird.
Ultralytics löst dieses Problem mit ihrer Cloud-Trainingsoption. Sie bietet eine einsatzbereite Umgebung, in der Python und Frameworks wie PyTorch bereits vorkonfiguriert PyTorch , sodass Sie ohne zusätzliche Einrichtung mit dem Training beginnen können.
Über ein einziges Dashboard können Sie Trainingsaufträge starten und den Fortschritt in Echtzeit überwachen. So können Sie sich besser auf die Verbesserung Ihrer Modelle konzentrieren, anstatt sich um die Verwaltung der Infrastruktur kümmern zu müssen.
Schauen wir uns nun an, wie man mit dem Cloud-Training auf Ultralytics beginnt.
Der erste Schritt besteht darin, ein Basismodell für Ihren Trainingslauf auszuwählen. Sie können ein vortrainiertes YOLO auswählen, ein Community-Modell klonen oder Ihre eigenen vortrainierten Gewichte hochladen, um individuellen Anforderungen gerecht zu werden.
Die Plattform unterstützt alle Ultralytics YOLO , einschließlich Ultralytics , Ultralytics YOLO11, Ultralytics YOLOv8und Ultralytics YOLOv5, jeweils in verschiedenen Größenvarianten wie Nano (n), Small (s), Medium (m), Large (l) und Extra-Large (x) erhältlich. Da die verschiedenen Modellvarianten einen Kompromiss zwischen Geschwindigkeit und Genauigkeit bieten, können Sie ein Modell wählen, das Ihren Leistungs- und Rechenanforderungen entspricht.
Diese Modelle unterstützen eine Reihe von Aufgaben im Bereich der Bildverarbeitung, mit denenYOLO Ultralytics YOLO bereits vertraut sind, darunter Objekterkennung, Instanzsegmentierung, Bildklassifizierung, Erkennung orientierter Begrenzungsrahmen (OBB) und Posenabschätzung.
Wenn Sie spezielle Anforderungen haben, können Sie auch Ihre eigenen vortrainierten Modellgewichte hochladen. Das bedeutet, dass Sie ein bestehendes Modell, wie beispielsweise einen Objektdetektor, innerhalb der Plattform weiter trainieren oder feinabstimmen können, anstatt ganz von vorne anzufangen. Dies ist besonders nützlich, wenn Sie ein Modell bereits an anderer Stelle trainiert haben oder ein Modell an einen spezifischeren Anwendungsfall anpassen möchten.
Der nächste Schritt ist die Auswahl eines Datensatzes für das Training. Auf der Ultralytics können Sie bereits vorhandene Datensätze wie den COCO verwenden, Datensätze aus der Community klonen oder Ihren eigenen, auf Ihre spezifische Anwendung zugeschnittenen Datensatz hochladen.
Die Plattform unterstützt gängige Annotationsformate wie Ultralytics YOLO COCO und ermöglicht zudem das Hochladen von Rohbildern, falls Sie beabsichtigen, benutzerdefinierte Daten direkt auf der Plattform zu annotieren.
Nach dem Hochladen werden die Datensätze automatisch verarbeitet, einschließlich Validierung, Normalisierung, Auswertung der Labels und Erstellung von Statistiken. So erhalten Sie sofort einen Überblick über Ihre Daten, einschließlich der Klassenverteilungen und der Struktur des Datensatzes, und können sicherstellen, dass alles für das Training bereit ist.
Datensätze werden zudem automatisch mit Trainingsläufen verknüpft, sodass Sie track Daten für jedes Modell verwendet wurden, und die Konsistenz zwischen den Experimenten gewährleisten können.
Nachdem Sie den Datensatz ausgewählt haben, können Sie die Trainingsparameter konfigurieren, die bestimmen, wie das Modell lernt. Dazu gehören Epochen, Batchgröße, Bildgröße und der Name des Laufs für das Trainingsprotokoll. Viele dieser Parameter beeinflussen sowohl die Trainingsdauer als auch die endgültige Leistungsfähigkeit des Modells.
Für ein gezielteres Training können Sie auf der Plattform zudem erweiterte Parameter wie die Lernrate, den Optimierertyp, die Einstellungen für die Farberweiterung und weitere Trainingsoptionen anpassen. Mit diesen Einstellungen lässt sich der Trainingsprozess feinabstimmen, um die Genauigkeit und Stabilität des Modells zu verbessern.
Als Nächstes können Sie die GPU für Ihren Trainingslauf auswählen. Die Wahl der richtigen GPU von Faktoren wie der Größe des Datensatzes, der Batch-Größe, der Bildauflösung und der Komplexität des Modells GPU . Das richtige Gleichgewicht zu finden, trägt dazu bei, das Training effizient zu gestalten, ohne mehr Rechenleistung als nötig zu verbrauchen.
Ultralytics bietet 22 GPU mit unterschiedlichen VRAM-Kapazitäten (Speicher auf einer GPU) und Rechenleistung und unterstützt damit alles von kleinen Aufgaben bis hin zu umfangreichen Workloads.
Auf diese Weise können Sie die Hardware genau an Ihre individuellen Anforderungen anpassen, ganz gleich, ob Sie leichte Modelle trainieren oder mit großen, komplexen Datensätzen arbeiten. Weitere Informationen finden Sie in der Liste der verfügbaren GPUs auf der Seitemit den Schulungsunterlagen der Ultralytics-Plattform.

Sobald Sie das Modell, den Datensatz, die Trainingsparameter und die Rechenoption ausgewählt haben, lässt sich ein Trainingslauf schnell starten. Über das Dashboard können Sie das Training mit einem einzigen Klick starten, und die Plattform kümmert sich um den Rest, indem sie die Umgebung initialisiert und den Job auf der ausgewählten GPU ausführt.
Sobald das Training beginnt, können Sie den Fortschritt direkt innerhalb der Plattform verfolgen. Über die Registerkarte „Train“ erhalten Sie in Echtzeit Einblick in wichtige Kennzahlen, darunter Leistungskennzahlen, Verlustkurven, Systemauslastung und Live-Trainingsprotokolle.
Wenn Sie mehr über das Training vor Ort oder die Verwendung von Google mit Ultralytics erfahren möchten, finden Sie weitere Tutorials in der offiziellenDokumentation zur Ultralytics-Plattform.
Sobald das Training abgeschlossen ist, besteht der nächste Schritt darin, die Leistung Ihres Modells zu bewerten. Auf Ultralytics können Sie mehrere Trainingsläufe innerhalb eines Projekts miteinander vergleichen und erhalten so einen klaren Überblick über die Ergebnisse der verschiedenen Experimente.
Bei der Entwicklung von Modellen wird das Training oft mehrfach mit unterschiedlichen Einstellungen wiederholt, beispielsweise durch Änderung der Lernrate, der Batch-Größe oder der Modellgröße, um die Ergebnisse zu verbessern. Jeder dieser Durchläufe führt zu einem leicht abweichenden Modell, weshalb ein Vergleich dieser Modelle von entscheidender Bedeutung ist.
Projekte dienen als zentrale Drehscheibe, in der Modelle und Experimente gebündelt werden. Sie können track , Ergebnisse überprüfen und den Überblick behalten, ohne zwischen verschiedenen Tools oder Ansichten hin- und herwechseln zu müssen.
In dieser einheitlichen Ansicht können Sie zudem wichtige Leistungskennzahlen wie Präzision, Recall und mAP Mean Average Precision) analysieren, um zu verstehen, wie Ihr Modell in den verschiedenen Klassen abschneidet. Außerdem können Sie Trainingsläufe nebeneinander vergleichen, um festzustellen, welche Konfigurationen die besten Ergebnisse liefern.
Ergänzend zu diesen Kennzahlen können Sie auf der Registerkarte „Predict“ trainierte Modelle schnell an Beispielbildern oder -daten testen, um die Leistung visuell zu überprüfen und mögliche Probleme zu erkennen.
Mit diesen Erkenntnissen können Sie das Modell mit der besten Leistung auswählen – das in der Regel als Checkpoint „best.pt“ gespeichert ist – und zur nächsten Phase übergehen, sei es eine weitere Bewertung, die Verwendung des Modells für Inferenzberechnungen oder die Bereitstellung des Modells über die Plattform.

Das Trainieren von Objekterkennungsmodellen in der Cloud verursacht Rechenkosten, insbesondere wenn Sie auf leistungsstarke GPUs zugreifen. Um dies zu vereinfachen, liefert Ultralytics vor Beginn des Trainings eine Kostenschätzung.
So erhalten Sie einen klaren Überblick über den voraussichtlichen Ressourcenverbrauch, was Ihnen hilft, Workloads zu planen, Budgets zu verwalten und unerwartete Kosten zu vermeiden, bevor Sie einen Trainingsjob starten. So können Sie die geschätzten Kosten vor Beginn des Trainings überprüfen.
Um die Kosten genau zu schätzen, berechnet die Plattform zunächst, wie lange eine einzelne Trainings-Epochen dauert. Dies hängt von Faktoren wie der Größe des Datensatzes, der Modellgröße, der Bildauflösung, der Batch-Größe und der Geschwindigkeit der ausgewählten GPU ab.
Anhand dieser Eingaben ermittelt das System die geschätzte Zeit pro Epoche und skaliert diese auf den gesamten Trainingsdurchlauf. Die Gesamtdauer wird berechnet, indem die Zeit aller Epochen mit einem geringen Start-Overhead addiert wird.
Der Overhead umfasst Aufgaben wie die Initialisierung der Umgebung, das Laden von Datensätzen und die Vorbereitung der GPU, wodurch sichergestellt wird, dass die Schätzung den gesamten Trainingsprozess widerspiegelt und nicht nur die Trainingsschleife.
Sobald die geschätzte Gesamtlaufzeit ermittelt wurde, rechnet die Plattform diese anhand des Stundensatzes GPU ausgewählten GPU in Kosten um.
Indem wir die Trainingsdauer mit GPU kombinieren, können wir schon vor Beginn des Laufs eine genaue Schätzung der Kosten erstellen.
Dank dieser Vorab-Transparenz lassen sich Ihre Einstellungen ganz einfach anpassen, beispielsweise durch die Optimierung von Trainingsparametern oder die Auswahl einer anderen GPU, sodass Sie Leistung und Kosten effektiver aufeinander abstimmen können.

Bisher haben wir die wichtigsten Schritte beim Training von Computer-Vision-Modellen durchgesprochen und erläutert, wie diese auf der Ultralytics zusammenwirken.
Neben diesen Kernfunktionen gibt es weitere Funktionen, die den Trainingsablauf optimieren. Hier ein Überblick über einige der wichtigsten Vorteile der Ultralytics für das Modelltraining:
Das Training ist eine der wichtigsten Phasen im Lebenszyklus eines Modells für maschinelles Lernen. Es entscheidet darüber, wie genau ein Modell visuelle Daten erkennen und interpretieren kann.
Durch die Zusammenführung von Trainingsdatenkonfiguration, Überwachung, Experimentvergleich und Kostenschätzung in einer einzigen Umgebung optimiert die Ultralytics den Prozess der Entwicklung leistungsstarker Computer-Vision-Modelle und deren Vorbereitung für den Einsatz.
Schauen Sie sich unsere wachsende Community und unser GitHub-Repository an, um mehr über Computer Vision zu erfahren. Wenn Sie Bildverarbeitungslösungen entwickeln möchten, informieren Sie sich über unsere Lizenzoptionen. Auf unseren Lösungsseiten erfahren Sie mehr über die Vorteile von Computer Vision in der Fertigung und von KI in der Landwirtschaft.
Beginnen Sie Ihre Reise mit der Zukunft des maschinellen Lernens