Schalten Sie ein zu YOLO Vision 2025!
25. September 2025
10:00 — 18:00 Uhr BST
Hybride Veranstaltung
Yolo Vision 2024
Glossar

Benchmark-Datensatz

Entdecken Sie, wie Benchmark-Datensätze die KI-Innovation vorantreiben, indem sie eine faire Modellevaluierung, Reproduzierbarkeit und Fortschritte im maschinellen Lernen ermöglichen.

Ein Benchmark-Datensatz ist ein standardisierter, qualitativ hochwertiger Datensatz, der im maschinellen Lernen (ML) verwendet wird, um die Leistung verschiedener Algorithmen und Modelle auf faire und reproduzierbare Weise zu bewerten und zu vergleichen. Diese Datensätze sind sorgfältig kuratiert und werden von der Forschungsgemeinschaft allgemein akzeptiert. Sie dienen als gemeinsame Grundlage für die Messung von Fortschritten bei bestimmten Aufgaben wie Objekterkennung oder Bildklassifizierung. Durch das Testen von Modellen anhand derselben Daten und Bewertungskennzahlen können Forscher und Entwickler objektiv feststellen, welche Ansätze effektiver, schneller oder effizienter sind. Die Verwendung von Benchmarks ist grundlegend für die Weiterentwicklung des Stands der Technik in der künstlichen Intelligenz (KI).

Die Bedeutung von Benchmarking

Im sich schnell entwickelnden Bereich der Computer Vision (CV) sind Benchmark-Datensätze unverzichtbar. Sie bieten eine stabile Basis für die Bewertung von Modellverbesserungen und Innovationen. Ohne sie wäre es schwierig zu wissen, ob eine neue Modellarchitektur oder Trainings-Technik wirklich einen Fortschritt darstellt oder ob ihre Leistung einfach darauf zurückzuführen ist, dass sie auf einem anderen, potenziell einfacheren Datensatz getestet wurde. Öffentliche Bestenlisten, die oft mit Herausforderungen wie der ImageNet Large Scale Visual Recognition Challenge (ILSVRC) verbunden sind, nutzen diese Datensätze, um einen gesunden Wettbewerb zu fördern und den Fortschritt transparent zu verfolgen. Dieser Prozess fördert die Entwicklung robusterer und generalisierbarer Modelle, was für die Modellbereitstellung in der realen Welt entscheidend ist.

Beispiele aus der Praxis

  1. Vergleich von Objekterkennungsmodellen: Wenn Ultralytics ein neues Modell wie YOLO11 entwickelt, wird seine Leistung rigoros auf Standard-Benchmark-Datensätzen wie COCO getestet. Die Ergebnisse, gemessen anhand von Metriken wie Mean Average Precision (mAP), werden mit früheren Versionen (YOLOv8, YOLOv10) und anderen hochmodernen Modellen verglichen. Diese Modellvergleiche helfen Benutzern, das beste Modell für ihre Bedürfnisse auszuwählen. Plattformen wie Ultralytics HUB ermöglichen es Benutzern, Modelle zu trainieren und sie auf benutzerdefinierten Daten zu benchmarken.
  2. Förderung des autonomen Fahrens: Unternehmen, die Technologien für autonome Fahrzeuge entwickeln, verlassen sich stark auf Benchmarks wie Argoverse oder nuScenes. Diese Datensätze enthalten komplexe städtische Fahrszenarien mit detaillierten Annotationen für Autos, Fußgänger und Radfahrer. Durch die Evaluierung ihrer Wahrnehmungsmodelle anhand dieser Benchmarks können Unternehmen Verbesserungen der Erkennungsgenauigkeit, der Tracking-Zuverlässigkeit und der gesamten System-Robustheit messen, was für die Gewährleistung der Sicherheit in der KI für selbstfahrende Autos von entscheidender Bedeutung ist.

Benchmark vs. andere Datensätze

Es ist wichtig, Benchmark-Datensätze von anderen Datensplits zu unterscheiden, die im ML-Lebenszyklus verwendet werden:

  • Daten zur Ausbildung: Sie werden verwendet, um das Modell zu trainieren, indem seine Parameter auf der Grundlage von Eingabebeispielen und ihren entsprechenden Bezeichnungen angepasst werden. Dies ist normalerweise der größte Teil der Daten. Techniken wie die Datenerweiterung werden hier oft angewandt.
  • Validierungsdaten: Werden während des Trainings verwendet, um die Hyperparameter des Modells zu optimieren (z. B. die Lernrate oder die Wahl der Architektur) und eine unvoreingenommene Schätzung der Modellfähigkeit zu liefern. Dies hilft, eine Überanpassung an die Trainingsdaten zu verhindern.
  • Test Daten: Wird verwendet , nachdem das Modell vollständig trainiert wurde, um eine endgültige, unvoreingenommene Bewertung seiner Leistung bei ungesehenen Daten zu erhalten.

Während ein Benchmark-Datensatz oft als standardisierter Testsatz dient, ist sein Hauptzweck breiter gefasst: einen gemeinsamen Standard für den Vergleich in der gesamten Forschungsgemeinschaft zu bieten. Viele Benchmark-Datensätze werden auf Plattformen wie Papers with Code aufgelistet und nachverfolgt, die Bestenlisten für verschiedene ML-Aufgaben bereitstellen. Andere bemerkenswerte Datensätze sind Open Images V7 von Google und der Pascal VOC-Wettbewerb. Der Zugang zu solchen hochwertigen Computer-Vision-Datensätzen ist für jeden, der zuverlässige KI-Systeme entwickelt, unerlässlich.

Treten Sie der Ultralytics-Community bei

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert