Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Zurück zum Ultralytics Glossar

Convolutional Neural Network (CNN)

Erkunde, wie Convolutional Neural Networks (CNNs) moderne Computer Vision antreiben. Lerne mehr über Ebenen, Anwendungen und wie du Ultralytics YOLO26 für Echtzeit-KI ausführst.

Ein Convolutional Neural Network (CNN) ist eine spezialisierte Deep-Learning-Architektur, die für die Verarbeitung von Daten mit einer gitterartigen Topologie entwickelt wurde, insbesondere für digitale Bilder. Inspiriert von der biologischen Struktur des visuellen Kortex, sind CNNs in der Lage, räumliche Beziehungen innerhalb von Eingabedaten zu bewahren. Im Gegensatz zu herkömmlichen neuronalen Netzwerken, die ein Bild in eine lange Liste von Zahlen flachklopfen, analysieren CNNs kleine, überlappende Bereiche eines Bildes, um automatisch Hierarchien von Merkmalen zu erlernen – von einfachen Kanten und Texturen bis hin zu komplexen Formen und Objekten. Diese Fähigkeit macht sie zur grundlegenden Technologie hinter modernen Computer Vision (CV)-Systemen.

Link to this sectionWie Convolutional Neural Networks funktionieren#

Die Stärke eines CNN liegt in seiner Fähigkeit, ein komplexes Bild auf eine Form zu reduzieren, die einfacher zu verarbeiten ist, ohne dabei wichtige Merkmale für eine gute Vorhersage zu verlieren. Dies wird durch eine Pipeline aus verschiedenen Schichten erreicht, die das Eingabevolumen in eine Ausgabeklasse oder einen Wert umwandeln:

  • Convolution Layer: Dies ist der grundlegende Baustein. Er verwendet einen Satz erlernbarer Filter (oder Kernels), die wie eine Taschenlampe über das Eingabebild gleiten. An jeder Position führt der Filter eine mathematische Operation namens Faltung aus und erstellt eine Feature Map, die spezifische Muster wie horizontale Linien oder Farbverläufe hervorhebt.
  • Activation Function: Nach der Faltung wird eine nicht-lineare Funktion auf die Ausgabe angewendet. Die gebräuchlichste Wahl ist die ReLU (Rectified Linear Unit), die negative Pixelwerte auf null setzt. Dies führt Nichtlinearität ein, wodurch das Netzwerk komplexe Muster jenseits einfacher linearer Beziehungen erlernen kann.
  • Pooling Layer: Auch als Downsampling bekannt, reduziert diese Schicht die Dimensionalität der Feature Maps. Techniken wie Max Pooling behalten nur die wichtigsten Merkmale (die höchsten Werte) in einer Region bei, was die Rechenlast verringert und hilft, Overfitting zu vermeiden.
  • Fully Connected Layer: In der letzten Stufe werden die verarbeiteten Merkmale abgeflacht und in ein Standard-Neural Network (NN) eingespeist. Diese Schicht nutzt die von den vorherigen Schichten identifizierten High-Level-Merkmale, um eine endgültige Klassifizierung oder Vorhersage zu treffen, wie etwa „Katze“ oder „Hund“.

Link to this sectionPraxisanwendungen#

CNNs haben Branchen revolutioniert, indem sie visuelle Aufgaben mit übermenschlicher Genauigkeit automatisieren.

  • Medizinische Diagnostik: Im Gesundheitswesen unterstützen CNNs Radiologen dabei, Anomalien in medizinischen Scans schneller als das menschliche Auge zu erkennen. Zum Beispiel analysieren Deep-Learning-Modelle MRI- und CT-Scans, um frühe Anzeichen von Tumoren oder Frakturen zu erkennen. Forschung im Bereich KI in der Radiologie zeigt, wie diese Werkzeuge die Konsistenz und Geschwindigkeit von Diagnosen verbessern.
  • Autonome Systeme: Selbstfahrende Autos verlassen sich stark auf CNNs, um ihre Umgebung wahrzunehmen. Modelle wie YOLO26 nutzen effiziente CNN-Backbones, um Object Detection in Echtzeit durchzuführen und Fußgänger, Verkehrsschilder sowie andere Fahrzeuge zu identifizieren, um in Sekundenbruchteilen Fahrentscheidungen zu treffen.

Link to this sectionCNNs vs. Vision Transformers (ViT)#

Während CNNs lange Zeit der Standard für Vision-Aufgaben waren, hat sich eine neuere Architektur namens Vision Transformer (ViT) etabliert.

  • CNNs verarbeiten Bilder mithilfe lokaler Merkmale und sind aufgrund ihres „induktiven Bias“ (sie gehen davon aus, dass nahe beieinander liegende Pixel zusammengehören) bei kleineren Datensätzen äußerst effizient. Sie zeichnen sich in Szenarien aus, die Real-Time Inference auf Edge-Geräten erfordern.
  • ViTs unterteilen Bilder in Patches und verarbeiten diese mithilfe globaler Self-Attention-Mechanismen. Dies ermöglicht es ihnen, weitreichende Abhängigkeiten über ein Bild hinweg zu erfassen, erfordert jedoch in der Regel riesige Datensätze und mehr Rechenleistung, um effektiv trainiert zu werden.

Link to this sectionImplementierungsbeispiel#

Moderne Bibliotheken machen die Verwendung von CNN-basierten Modellen unkompliziert. Das Paket ultralytics bietet Zugriff auf modernste Modelle wie YOLO26, die über hochoptimierte CNN-Architekturen für schnelle Inferenz verfügen.

Das folgende Beispiel demonstriert, wie man ein vortrainiertes CNN-Modell lädt und eine Vorhersage durchführt:

from ultralytics import YOLO

# Load a YOLO26 model, which uses an advanced CNN architecture
model = YOLO("yolo26n.pt")

# Run inference on an image to identify objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the prediction results
results[0].show()

Link to this sectionWerkzeuge für die Entwicklung#

Die Entwicklung von CNNs wird durch ein robustes Ökosystem aus Open-Source-Tools unterstützt. Ingenieure verwenden typischerweise Frameworks wie PyTorch oder TensorFlow, um eigene Architekturen zu erstellen. Diese Bibliotheken stellen die Low-Level-Tensor-Operationen bereit, die für Faltung und Backpropagation erforderlich sind.

Für Teams, die den Lebenszyklus von Computer-Vision-Projekten – von der Datenerfassung bis zur Bereitstellung – optimieren möchten, bietet die Ultralytics Platform eine umfassende Lösung. Sie vereinfacht komplexe Arbeitsabläufe und ermöglicht es Entwicklern, sich auf die Anwendung von CNNs zur Lösung geschäftlicher Probleme zu konzentrieren, anstatt die Infrastruktur zu verwalten. Zusätzlich können Modelle in Formate wie ONNX oder TensorRT exportiert werden, um eine hochperformante Bereitstellung auf Edge-Geräten zu ermöglichen.

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens