Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Zurück zum Ultralytics Glossar

Object Detection Architectures

Erkunde Objekterkennungsarchitekturen, von Backbones bis zu Heads. Lerne, wie Ultralytics YOLO26 erstklassige Geschwindigkeit und Genauigkeit für Echtzeit-Computer-Vision liefert.

Objekterkennungsarchitekturen sind die strukturellen Blaupausen der neuronalen Netze, die zur Identifizierung und Lokalisierung von Objekten innerhalb visueller Daten verwendet werden. Im weiteren Bereich der Computer Vision (CV) definieren diese Architekturen, wie eine Maschine "sieht", indem sie rohe Pixeldaten in aussagekräftige Erkenntnisse umwandelt. Im Gegensatz zu einfachen Klassifizierungsmodellen, die ein Bild lediglich mit einem Label versehen, ist eine Objekterkennungsarchitektur darauf ausgelegt, für jedes gefundene Objekt einen BBox zusammen mit einer Klassenbezeichnung und einem confidence score auszugeben. Dieses strukturelle Design bestimmt die Geschwindigkeit, Genauigkeit und rechnerische Effizienz des Modells und macht es zum entscheidenden Faktor bei der Auswahl eines Modells für real-time inference oder Hochpräzisionsanalysen.

Link to this sectionKernkomponenten einer Architektur#

While specific designs vary, most modern architectures share three fundamental components: the backbone, the neck, and the head. The backbone acts as the primary feature extractor. It is typically a Convolutional Neural Network (CNN) pre-trained on a large dataset like ImageNet, responsible for identifying basic shapes, edges, and textures. Popular choices for backbones include ResNet and CSPDarknet.

Der neck verbindet das Backbone mit den finalen Ausgabeschichten. Seine Aufgabe ist es, Merkmale aus verschiedenen Stadien des Backbones zu mischen und zu kombinieren, um sicherzustellen, dass das Modell Objekte unterschiedlicher Größe erkennen kann – ein Konzept, das als Multi-Scale Feature Fusion bekannt ist. Architekturen verwenden hier oft ein Feature Pyramid Network (FPN) oder ein Path Aggregation Network (PANet), um die an die Vorhersageschichten weitergeleiteten semantischen Informationen anzureichern. Schließlich verarbeitet der detection head diese fusionierten Merkmale, um die spezifische Klasse und den Standort jedes Objekts vorherzusagen.

Link to this sectionEvolution: Zwei-Stufen- vs. Ein-Stufen-Detektoren#

Historisch gesehen wurden Architekturen in zwei Hauptkategorien unterteilt. Zwei-Stufen-Detektoren wie die R-CNN-Familie schlagen zunächst Regionen von Interesse (RoIs) vor, in denen Objekte existieren könnten, und klassifizieren diese Regionen dann in einem zweiten Schritt. Obwohl sie im Allgemeinen genau sind, sind sie für Edge-Geräte oft zu rechenintensiv.

Im Gegensatz dazu behandeln Ein-Stufen-Detektoren die Erkennung als einfaches Regressionsproblem, bei dem Bildpixel in einem einzigen Durchgang direkt auf BBox-Koordinaten und Klassenwahrscheinlichkeiten abgebildet werden. Dieser Ansatz, der von der YOLO-Familie (You Only Look Once) entwickelt wurde, hat die Branche durch die Ermöglichung von Echtzeitleistung revolutioniert. Moderne Fortschritte haben in Modellen wie YOLO26 gegipfelt, die nicht nur überlegene Geschwindigkeit bieten, sondern auch end-to-end, NMS-freie Architekturen übernommen haben. Durch den Verzicht auf eine Non-Maximum Suppression (NMS)-Nachbearbeitung reduzieren diese neueren Architekturen die Latenzvariabilität, was für sicherheitskritische Systeme entscheidend ist.

Link to this sectionPraxisanwendungen#

Die Wahl der Architektur beeinflusst direkt den Erfolg von KI-Lösungen in allen Branchen.

  • Einzelhandelsautomatisierung: In intelligenten Supermärkten ermöglichen effiziente Ein-Stufen-Architekturen automatisierte Kassensysteme, die Produkte auf einem Förderband oder in einem Einkaufswagen sofort erkennen, was Wartezeiten und menschliche Fehler reduziert.
  • Medizinische Diagnostik: Hochpräzisionsarchitekturen werden in der medizinischen Bildanalyse eingesetzt, um Anomalien wie Tumoren in Röntgen- oder MRT-Aufnahmen zu erkennen. Hier ist die Fähigkeit der Architektur, fein abgestufte Details beizubehalten, wichtiger als die reine Verarbeitungsgeschwindigkeit.

Link to this sectionUnterscheidung verwandter Begriffe#

Es ist wichtig, Erkennungsarchitekturen von ähnlichen Computer-Vision-Aufgaben zu unterscheiden:

  • vs. Bildklassifizierung: Eine image classification-Architektur (wie VGG oder EfficientNet) weist einem gesamten Bild ein einziges Label zu (z. B. "Katze"). Sie gibt nicht an, wo die Katze ist oder ob es mehrere Katzen gibt, was die Hauptfunktion von Erkennungsarchitekturen ist.
  • vs. Instanzsegmentierung: Während die Erkennung ein Objekt mit einem Kasten umgibt, identifiziert die instance segmentation den präzisen, pixelgenauen Umriss (Maske) jedes Objekts. Segmentierungsarchitekturen sind oft Erweiterungen von Erkennungsarchitekturen (z. B. durch das Hinzufügen eines Masken-Zweigs zum Detection Head).

Link to this sectionImplementierung mit Ultralytics#

Moderne Frameworks haben die Komplexität dieser Architekturen abstrahiert, sodass du modernste Designs mit minimalem Code nutzen kannst. Mit dem ultralytics-Paket kannst du ein vortrainiertes YOLO26-Modell laden und sofort die Inferenz ausführen. Für Teams, die ihre Datensätze verwalten und benutzerdefinierte Architekturen in der Cloud trainieren möchten, vereinfacht die Ultralytics Platform die gesamte MLOps-Pipeline.

from ultralytics import YOLO

# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Run inference on an image source
# This uses the model's architecture to detect objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens