Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Zurück zum Ultralytics Glossar

Convolution

Erkunde die Grundlagen der Faltung (Convolution) in Computer Vision und Deep Learning. Lerne, wie Kernel und Feature-Maps Ultralytics YOLO26 für Echtzeitaufgaben antreiben.

Faltung ist eine grundlegende mathematische Operation, die als zentraler Baustein moderner Computer Vision (CV) und Deep Learning (DL) Systeme dient. Im Kontext der Bildverarbeitung beinhaltet die Faltung das Verschieben eines kleinen Filters – oft als Kernel bezeichnet – über ein Eingabebild, um eine Karte signifikanter Merkmale zu erstellen. Dieser Prozess ermöglicht es künstlicher Intelligenz (AI) Modellen, automatisch Muster wie Kanten, Texturen und Formen ohne menschliches Eingreifen zu erlernen und zu identifizieren. Im Gegensatz zum traditionellen Machine Learning (ML), das oft eine manuelle Merkmalsextraktion erfordert, ermöglicht die Faltung Netzwerken den Aufbau eines hierarchischen Verständnisses visueller Daten, beginnend bei einfachen Linien bis hin zu komplexen Objekten wie Gesichtern oder Fahrzeugen.

Link to this sectionWie Faltung funktioniert#

Die Operation funktioniert, indem ein Filter über die Eingabedaten geführt wird, eine elementweise Multiplikation durchgeführt wird und die Ergebnisse summiert werden, um für jede Position einen einzelnen Wert zu erzeugen. Dieser Output wird als Feature Map bezeichnet.

  • Der Kernel: Dies ist eine kleine Matrix aus Zahlen (Gewichten), die spezifische Merkmale erkennt. Zum Beispiel ist ein Sobel-Operator eine spezielle Art von Kernel, der verwendet wird, um vertikale oder horizontale Kanten zu erkennen.
  • Sliding Window: Der Kernel bewegt sich mit einer definierten Schrittweite, dem sogenannten "Stride", über das Bild. Dieser Prozess der räumlichen Filterung bewahrt die Beziehung zwischen Pixeln, was für das Verständnis von Bildern entscheidend ist.
  • Schichthierarchie: In tiefen Architekturen wie Convolutional Neural Networks (CNNs) erfassen die anfänglichen Schichten niedrigstufige Details, während tiefere Schichten diese zu komplexeren Konzepten kombinieren.

Link to this sectionFaltung vs. verwandte Konzepte#

Um Faltung vollständig zu verstehen, ist es hilfreich, sie von ähnlichen Begriffen zu unterscheiden, denen man in der Literatur zu Neural Networks (NN) häufig begegnet:

  • Kreuzkorrelation vs. Faltung: Mathematisch gesehen beinhaltet die echte Faltung das Spiegeln des Kernels vor der Anwendung. Die meisten Deep-Learning-Frameworks, einschließlich der PyTorch library, implementieren jedoch Kreuzkorrelation (Verschieben ohne Spiegeln), bezeichnen sie aber als "Faltung", da die Gewichte während des Trainings gelernt werden, was den Unterschied durch das Spiegeln für die Leistung irrelevant macht.
  • Faltung vs. Attention: Während Faltung Informationen lokal verarbeitet (benachbarte Pixel), ermöglicht der Attention Mechanism es einem Modell, entfernte Teile eines Bildes gleichzeitig miteinander in Beziehung zu setzen. Moderne Architekturen wie YOLO26 nutzen oft hochoptimierte Faltungsschichten, um Echtzeit-Inferenz Geschwindigkeiten beizubehalten, da Attention-Schichten rechenintensiver sein können.

Link to this sectionPraxisanwendungen#

Die Effizienz der Faltung hat es KI ermöglicht, verschiedene Branchen zu revolutionieren, indem sie robuste Wahrnehmungssysteme antreibt:

  1. Medizinische Diagnostik: Im Bereich von AI in Healthcare hilft Faltung bei der Analyse hochauflösender MRI-Scans. Durch die Verwendung spezifischer Kernel, die darauf ausgelegt sind, Anomalien hervorzuheben, können Modelle frühe Anzeichen von Tumoren oder Frakturen mit einer Genauigkeit erkennen, die mit der von menschlichen Experten konkurriert.

  2. Autonome Navigation: Selbstfahrende Fahrzeuge verlassen sich auf Faltung für die Objekterkennung in Echtzeit. Während sich das Auto bewegt, verarbeiten Faltungsschichten Videostreams, um sofort Fußgänger, Fahrbahnmarkierungen und Verkehrsschilder zu identifizieren – eine kritische Komponente für die Sicherheit bei AI in Automotive.

Link to this sectionPython Beispiel mit Ultralytics#

Du kannst Faltungsschichten in modernsten Modellen mithilfe von Python untersuchen. Das folgende Beispiel lädt das YOLO26 Modell und überprüft, ob seine initiale Schicht eine standardmäßige Faltungsoperation nutzt, die über torch.nn implementiert ist.

import torch.nn as nn
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Access the first layer of the model's backbone
first_layer = model.model.model[0]

# Verify it is a Convolutional layer
if isinstance(first_layer.conv, nn.Conv2d):
    print("Success: The first layer is a standard convolution.")
    print(f"Kernel size: {first_layer.conv.kernel_size}")

Link to this sectionWarum Faltung wichtig für Edge AI ist#

Faltungsoperationen sind hochgradig optimierbar, was sie ideal für Edge AI Deployments macht, bei denen die Rechenressourcen begrenzt sind. Da derselbe Kernel über das gesamte Bild geteilt wird (Parameter Sharing), benötigt das Modell deutlich weniger Speicher als ältere, vollständig verbundene Architekturen. Diese Effizienz ermöglicht es, fortschrittliche Modelle auf Smartphones und IoT-Geräten auszuführen.

Für Teams, die diese Operationen für eigene Datensätze nutzen möchten, bietet die Ultralytics Platform eine nahtlose Umgebung, um Bilder zu annotieren und Faltungs-basierte Modelle zu trainieren, ohne komplexe Infrastruktur verwalten zu müssen. Durch die Nutzung von Transfer Learning kannst du vortrainierte Faltungsgewichte feinabstimmen, um neue Objekte mit minimalen Trainingsdaten zu erkennen.

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens