Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Zurück zum Ultralytics Glossar

Data Preprocessing

Lerne, wie Datenvorverarbeitung Rohdaten in saubere Eingaben für KI umwandelt. Erkunde Schlüsseltechniken wie Skalierung und Normalisierung, um die Genauigkeit von Ultralytics YOLO26 zu steigern.

Die Datenvorverarbeitung ist der entscheidende erste Schritt in der Machine-Learning-Pipeline, bei dem Rohdaten in ein sauberes und verständliches Format für Algorithmen umgewandelt werden. In der realen Welt sind Daten oft unvollständig, inkonsistent und weisen keine spezifischen Verhaltensweisen oder Trends auf, was sie für einen Computer "schmutzig" oder "verrauscht" erscheinen lässt. Die Vorverarbeitung schließt die Lücke zwischen Rohinformationen und den strukturierten Eingaben, die von neuronalen Netzen benötigt werden, und beeinflusst maßgeblich die Genauigkeit und Effizienz des finalen Modells. Durch die Standardisierung und Bereinigung von Datensätzen stellen Ingenieure sicher, dass hochentwickelte Architekturen wie YOLO26 aussagekräftige Muster anstelle von Rauschen erlernen können.

Link to this sectionWarum ist Datenvorverarbeitung wichtig?#

Machine-Learning-Modelle, insbesondere solche im Bereich Computer Vision, reagieren empfindlich auf die Qualität und Skalierung der Eingabedaten. Ohne eine ordnungsgemäße Vorverarbeitung könnte ein Modell Schwierigkeiten haben, während des Trainings zu konvergieren oder unzuverlässige Vorhersagen liefern. Wenn beispielsweise Bilder in einem Datensatz unterschiedliche Auflösungen oder Farbskalen haben, muss das Modell zusätzliche Kapazitäten aufwenden, um diese Inkonsistenzen zu bewältigen, anstatt sich auf die eigentliche Objekterkennung zu konzentrieren.

Vorverarbeitungstechniken zielen im Allgemeinen darauf ab:

  • Datenqualität verbessern: Entferne Fehler, Ausreißer und Duplikate, um sicherzustellen, dass der Datensatz den Problemraum korrekt repräsentiert.
  • Eingaben standardisieren: Skaliere Merkmale (wie Pixelwerte) auf einen einheitlichen Bereich, oft zwischen 0 und 1, um Optimierungsalgorithmen wie den Gradientenabstieg flüssiger funktionieren zu lassen.
  • Komplexität reduzieren: Vereinfache Datenrepräsentationen durch Techniken wie Dimensionsreduktion, um den Lernprozess zu beschleunigen.

Link to this sectionWichtige Techniken der Vorverarbeitung#

Mehrere Standardmethoden werden verwendet, um Daten für das Training vorzubereiten, wobei jede einen spezifischen Zweck in der Data Pipeline erfüllt.

  • Datenbereinigung: Dies beinhaltet den Umgang mit fehlenden Werten (Imputation), das Korrigieren inkonsistenter Beschriftungen und das Filtern korrupter Dateien. Im Kontext von Vision AI kann dies bedeuten, unscharfe Bilder zu entfernen oder falsche Bounding-Box-Koordinaten zu korrigieren.
  • Normalisierung und Skalierung: Da Pixelintensitäten stark variieren können, stellt die Normalisierung von Bildern sicher, dass hochwertige Pixel den Lernprozess nicht dominieren. Gängige Methoden umfassen Min-Max-Skalierung und Z-Score-Normalisierung.
  • Kodierung: Kategorische Daten, wie Klassen-Labels (z. B. "Katze", "Hund"), müssen in numerische Formate konvertiert werden. Techniken wie One-Hot-Encoding oder Label-Encoding sind Standardpraxis.
  • Größenänderung und Formatierung: Deep-Learning-Modelle erwarten typischerweise Eingaben einer festen Größe. Vorverarbeitungs-Pipelines ändern automatisch die Größe unterschiedlicher Bilder auf eine Standarddimension, wie 640x640 Pixel, was für die Echtzeit-Inferenz üblich ist.

Link to this sectionPraxisanwendungen#

Die Datenvorverarbeitung ist branchenübergreifend allgegenwärtig und stellt sicher, dass Rohdaten in umsetzbare Erkenntnisse übersetzt werden.

Link to this sectionDiagnose in der medizinischen Bildgebung#

In der Gesundheits-KI ist die Vorverarbeitung entscheidend für die Analyse von Röntgenbildern oder MRT-Scans. Medizinische Rohbilder enthalten oft Rauschen von Sensoren oder Schwankungen in Beleuchtung und Kontrast, abhängig von der verwendeten Maschine. Vorverarbeitungsschritte wie Histogramm-Equalization verbessern den Kontrast, um Tumore oder Frakturen besser sichtbar zu machen, während Rauschunterdrückungsfilter die Bildstruktur klären. Diese Vorbereitung ermöglicht es Modellen, eine Tumorerkennung mit höherer Präzision durchzuführen, was möglicherweise Leben rettet, indem falsch-negative Ergebnisse reduziert werden.

Link to this sectionAutonomes Fahren#

Selbstfahrende Autos stützen sich auf Eingaben mehrerer Sensoren, einschließlich LiDAR, Radar und Kameras. Diese Sensoren erzeugen Daten mit unterschiedlichen Raten und Skalen. Die Vorverarbeitung synchronisiert diese Streams und filtert Umgebungsrauschen wie Regen oder Blendung heraus, bevor die Daten zusammengeführt werden. Für autonome Fahrzeuge stellt dies sicher, dass das Wahrnehmungssystem eine kohärente Sicht auf die Straße erhält, was eine sichere Navigation und zuverlässige Fußgängererkennung in Echtzeitumgebungen ermöglicht.

Link to this sectionVerwandte Konzepte#

Es ist wichtig, die Datenvorverarbeitung von anderen Begriffen zu unterscheiden, die im Machine-Learning-Workflow vorkommen.

  • vs. Datenaugmentation: Während die Vorverarbeitung Daten so aufbereitet, dass sie vom Modell technisch nutzbar sind (z. B. Größenänderung), erzeugt die Augmentation neue Variationen vorhandener Daten (z. B. Rotieren oder Spiegeln von Bildern), um die Diversität des Datensatzes zu erhöhen. Weitere Details findest du in unserem Leitfaden zur YOLO-Datenaugmentation.
  • vs. Feature Engineering: Bei der Vorverarbeitung geht es um das Bereinigen und Formatieren. Feature Engineering beinhaltet das Erstellen neuer, aussagekräftiger Variablen aus den Daten, um die Modellleistung zu verbessern, wie beispielsweise die Berechnung eines "Body-Mass-Index" aus Größen- und Gewichtsspalten.
  • vs. Datenlabeling: Labeling ist der Prozess der Definition der Grundwahrheit, wie das Zeichnen von Bounding Boxes um Objekte. Die Vorverarbeitung erfolgt nach der Datenerfassung und dem Labeling, aber bevor die Daten in das neuronale Netz eingespeist werden.

Link to this sectionPraktisches Beispiel#

Im Ultralytics-Ökosystem wird die Vorverarbeitung oft automatisch während der Trainings-Pipeline gehandhabt. Du kannst Bilder jedoch auch manuell mit Bibliotheken wie OpenCV vorverarbeiten. Der folgende Ausschnitt zeigt das Laden eines Bildes, dessen Größenanpassung auf eine Standard-Eingabegröße für ein Modell wie YOLO26 und die Normalisierung von Pixelwerten.

import cv2
import numpy as np

# Load an image using OpenCV
image = cv2.imread("bus.jpg")

# Resize the image to 640x640, a standard YOLO input size
resized_image = cv2.resize(image, (640, 640))

# Normalize pixel values from 0-255 to 0-1 for model stability
normalized_image = resized_image / 255.0

# Add a batch dimension (H, W, C) -> (1, H, W, C) for inference
input_tensor = np.expand_dims(normalized_image, axis=0)

print(f"Processed shape: {input_tensor.shape}")

Für groß angelegte Projekte kann die Nutzung von Tools wie der Ultralytics Platform diese Workflows optimieren. Die Plattform vereinfacht das Dataset Management und automatisiert viele Vorverarbeitungs- und Annotationsaufgaben, um den Übergang von Rohdaten zu einem bereitgestellten Modell zu beschleunigen.

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens