Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Zurück zum Ultralytics Glossar

Data Cleaning

Meistere die Datenbereinigung, um die Genauigkeit von KI-Modellen zu verbessern. Lerne Techniken, um Fehler zu entfernen, fehlende Werte zu verarbeiten und saubere Datensätze für Ultralytics YOLO26 vorzubereiten.

Datenbereinigung ist der entscheidende Prozess zum Erkennen und Korrigieren (oder Entfernen) von fehlerhaften, ungenauen oder irrelevanten Datensätzen aus einer Datenbank oder Tabelle. Im Bereich der künstlichen Intelligenz (KI) und des maschinellen Lernens (ML) wird dieser Schritt oft als der zeitaufwendigste, aber wichtigste Teil des Arbeitsablaufs angesehen. Bevor ein Modell wie YOLO26 effektiv lernen kann, Objekte zu erkennen, müssen die Trainingsdaten von Fehlern befreit werden, um das Phänomen "Garbage In, Garbage Out" zu verhindern, bei dem qualitativ minderwertiger Input zu unzuverlässigem Output führt.

Link to this sectionDie Bedeutung der Datenintegrität in der KI#

Leistungsstarke Computer Vision-Modelle sind in hohem Maße von der Qualität der Datensätze abhängig, die sie verarbeiten. Enthält ein Datensatz falsch beschriftete Bilder, Duplikate oder beschädigte Dateien, wird das Modell Schwierigkeiten haben, Muster zu verallgemeinern, was zu Overfitting oder einer schlechten Inferenzgenauigkeit führt. Eine effektive Datenbereinigung verbessert die Zuverlässigkeit von Vorhersagemodellen und stellt sicher, dass der Algorithmus von validen Signalen lernt und nicht von Rauschen.

Link to this sectionGängige Datenbereinigungstechniken#

Anwender nutzen verschiedene Strategien, um ihre Datensätze mit Tools wie Pandas für tabellarische Daten oder spezialisierten Vision-Tools zu verfeinern.

  • Umgang mit fehlenden Werten: Dies beinhaltet entweder das Entfernen von Datensätzen mit fehlenden Daten oder die Verwendung von Imputationstechniken, um Lücken auf der Grundlage statistischer Durchschnitte oder nächstgelegener Nachbarn zu füllen.
  • Entfernen von Duplikaten: Doppelte Bilder in einem Trainingsdatensatz können das Modell unbeabsichtigt verzerren. Das Entfernen dieser stellt sicher, dass das Modell keine spezifischen Beispiele auswendig lernt, was dabei hilft, Datensatz-Bias zu mindern.
  • Ausreißererkennung: Das Identifizieren und Handhaben von Anomalien oder Ausreißern, die signifikant von der Norm abweichen, ist entscheidend, da diese die statistische Analyse und die Modellgewichte verfälschen können.
  • Strukturelle Korrektur: Dies umfasst das Beheben von Tippfehlern in Klassenbezeichnungen (z. B. Korrektur von "Car" vs. "car"), um die Klassenkonsistenz zu gewährleisten.

Link to this sectionPraxisanwendungen#

Datenbereinigung ist in verschiedenen Branchen, in denen KI eingesetzt wird, von zentraler Bedeutung.

  • Medizinische Bildanalyse: In KI-Anwendungen im Gesundheitswesen enthalten Datensätze oft Scans mit Artefakten, falschen Patientenmetadaten oder irrelevantem Hintergrundrauschen. Die Bereinigung dieser Daten stellt sicher, dass sich Modelle für die medizinische Bildanalyse ausschließlich auf die für die Diagnose relevanten biologischen Marker konzentrieren.
  • Einzelhandelsbestandsverwaltung: Bei KI im Einzelhandel können Produktdatensätze veraltete Artikel oder Bilder mit falschen Seitenverhältnissen enthalten. Die Bereinigung dieser Datensätze stellt sicher, dass Objekterkennungsmodelle Lagerbestände genau identifizieren und Fehlalarme in einer Live-Umgebung reduzieren können.

Link to this sectionUnterscheidung zwischen Datenbereinigung und Vorverarbeitung#

Obwohl die Begriffe oft synonym verwendet werden, unterscheidet sich die Datenbereinigung von der Datenvorverarbeitung. Die Datenbereinigung konzentriert sich auf die Fehlerbehebung und das Entfernen von "schlechten" Daten. Im Gegensatz dazu beinhaltet die Vorverarbeitung die Umwandlung sauberer Daten in ein für das Modell geeignetes Format, wie z. B. Bildskalierung, Normalisierung oder die Anwendung von Datenaugmentierung zur Erhöhung der Vielfalt.

Link to this sectionAutomatisierung von Qualitätsprüfungen#

Moderne Arbeitsabläufe, wie sie auf der Ultralytics Platform verfügbar sind, integrieren automatisierte Prüfungen, um beschädigte Bilder oder Inkonsistenzen bei Beschriftungen zu identifizieren, bevor das Training beginnt. Unten findest du ein einfaches Python-Beispiel, das zeigt, wie man mit der Standard-Pillow-Bibliothek nach beschädigten Bilddateien sucht und diese identifiziert – ein gängiger Schritt, bevor Daten in ein Modell wie YOLO26 eingespeist werden.

from pathlib import Path

from PIL import Image


def verify_images(dataset_path):
    """Iterates through a directory to identify corrupt images."""
    for img_path in Path(dataset_path).glob("*.jpg"):
        try:
            with Image.open(img_path) as img:
                img.verify()  # Checks file integrity
        except (OSError, SyntaxError):
            print(f"Corrupt file found: {img_path}")


# Run verification on your dataset
verify_images("./coco8/images/train")

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens