Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Testdaten

Entdecken Sie die wichtige Rolle von Testdaten im maschinellen Lernen. Erfahren Sie, wie Sie die Leistung Ultralytics anhand unvoreingenommener Datensätze bewerten können, um die Genauigkeit in der Praxis sicherzustellen.

Testdaten sind eine bestimmte Teilmenge eines größeren Datensatzes, die ausschließlich für die Bewertung der endgültigen Leistung eines Modells für maschinelles Lernen (ML) reserviert ist. Im Gegensatz zu den Daten, die in früheren Lernphasen verwendet werden, bleiben Testdaten für den Algorithmus bis zum Ende des Entwicklungszyklus vollständig „unsichtbar“ . Diese Isolation ist entscheidend, da sie eine unvoreingenommene Bewertung darüber ermöglicht, wie gut ein Computer-Vision-Modell (CV) oder ein anderes KI-System auf neue, reale Eingaben verallgemeinert werden kann. Durch die Simulation einer Produktionsumgebung helfen Testdaten Entwicklern dabei, zu überprüfen, ob ihr Modell tatsächlich zugrunde liegende Muster gelernt hat und nicht nur die Trainingsbeispiele auswendig gelernt hat .

Die Rolle von Testdaten im ML-Lebenszyklus

Im Standard-Workflow des maschinellen Lernens werden Daten in der Regel in drei verschiedene Kategorien unterteilt, die jeweils einem bestimmten Zweck dienen. Das Verständnis der Unterschiede zwischen diesen Unterteilungen ist für den Aufbau robuster Systeme der künstlichen Intelligenz (KI) von entscheidender Bedeutung.

  • Trainingsdaten: Dies ist der größte Teil des Datensatzes, der zum Trainieren des Modells verwendet wird. Der Algorithmus passt seine internen Parameter oder Gewichte iterativ an, um Fehler bei diesem spezifischen Satz von Beispielen zu minimieren.
  • Validierungsdaten: Diese Teilmenge wird häufig während des Trainingsprozesses verwendet, um Hyperparameter anzupassen und Architekturentscheidungen zu steuern . Sie dient als Zwischenkontrolle, um Überanpassung zu verhindern, bei der ein Modell zwar bei Trainingsdaten gut funktioniert, bei neuen Daten jedoch versagt.
  • Testdaten: Dies ist die abschließende „Prüfung” für das Modell. Sie wird niemals zur Aktualisierung von Gewichten oder zur Feinabstimmung von Einstellungen verwendet. Die Auswertung der Testdaten liefert definitive Leistungskennzahlen wie Genauigkeit, Recall und Mean Average Precision (mAP), anhand derer die Beteiligten entscheiden, ob ein Modell für den Modelleinsatz bereit ist.

Die ordnungsgemäße Verwaltung dieser Aufteilungen wird häufig durch Tools wie die Ultralytics erleichtert, die hochgeladene Datensätze automatisch in diese wesentlichen Kategorien einordnet, um eine strenge Modellbewertung zu gewährleisten.

Bedeutung einer unvoreingenommenen Bewertung

Der Hauptnutzen von Testdaten liegt in ihrer Fähigkeit, Verzerrungen und Abweichungen im Datensatz detect . Wenn ein Modell bei Trainingsdaten eine Genauigkeit von 99 %, bei Testdaten jedoch nur von 60 % erreicht, deutet dies auf eine hohe Abweichung (Überanpassung) hin. Umgekehrt lässt eine schlechte Leistung bei beiden auf eine Unteranpassung schließen.

Die Verwendung eines festgelegten Testsatzes entspricht den wissenschaftlichen Prinzipien der Reproduzierbarkeit und Objektivität. Ohne einen makellosen Testsatz laufen Entwickler Gefahr, „auf den Test hin zu unterrichten“ und damit Informationen aus der Evaluierungsphase zurück in die Trainingsphase zu leiten – ein Phänomen, das als Datenleck bekannt ist. Dies führt zu übermäßig optimistischen Leistungsschätzungen, die zusammenbrechen, wenn das Modell mit realen Daten konfrontiert wird.

Anwendungsfälle in der Praxis

Testdaten sind in allen Branchen, die KI einsetzen, unerlässlich, um Sicherheit und Zuverlässigkeit zu gewährleisten, bevor Systeme in Betrieb genommen werden.

  • Autonomes Fahren: Bei der Entwicklung von autonomen Fahrzeugen können Trainingsdaten aus Millionen von Autobahnkilometern bei klarem Wetter bestehen. Die Testdaten müssen jedoch seltene und herausfordernde Szenarien enthalten – wie starken Schneefall, plötzliche Hindernisse oder verwirrende Verkehrszeichen –, die das Auto während des Trainings nie explizit „gesehen” hat. Dadurch wird sichergestellt, dass das Objekterkennungssystem in unvorhersehbaren Umgebungen sicher reagieren kann .
  • Gesundheitsdiagnostik: Bei der Erstellung eines Modells zur Tumorerkennung in der medizinischen Bildgebung kann der Trainingssatz aus der Datenbank eines bestimmten Krankenhauses stammen. Um zu überprüfen, ob das Modell robust und für den allgemeinen Gebrauch sicher ist, sollten die Testdaten idealerweise Scans aus verschiedenen Krankenhäusern umfassen, die mit unterschiedlichen Geräten aufgenommen wurden und eine vielfältige Patientengruppe repräsentieren. Diese externe Validierung bestätigt, dass die KI nicht auf einen bestimmten Gerätetyp oder eine bestimmte Population ausgerichtet ist.

Leistung mit Code bewerten

Die Verwendung des ultralytics Paket können Sie die Leistung eines Modells anhand eines zurückbehaltenen Datensatzes leicht bewerten. Während die val Der Modus wird häufig zur Validierung während des Trainings verwendet, kann aber auch so konfiguriert werden, dass er auf einer bestimmten in Ihrer YAML-Konfiguration des Datensatzes.

So bewerten Sie ein vortrainiertes YOLO26- Modell, um Metriken wie mAP50 zu erhalten:

from ultralytics import YOLO

# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")

# Evaluate the model's performance on the validation set
# (Note: In a strict testing workflow, you would point 'data'
# to a YAML that defines a specific 'test' split and use split='test')
metrics = model.val(data="coco8.yaml")

# Print a specific metric, e.g., mAP at 50-95% IoU
print(f"Mean Average Precision (mAP50-95): {metrics.box.map}")

Dieser Prozess generiert umfassende Metriken, die es Entwicklern ermöglichen, verschiedene Architekturen objektiv zu vergleichen, wie beispielsweise YOLO26 vs. YOLO11, und sicherzustellen, dass die gewählte Lösung den definierten Projektzielen entspricht. Strenge Tests sind der letzte Schritt, um sicherzustellen, dass hohe Sicherheitsstandards für KI erfüllt werden.

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten