Entdecken Sie, wie Convolutional Neural Networks (CNNs) moderne Computer Vision ermöglichen. Erfahren Sie mehr über Schichten, Anwendungen und die Ausführung von Ultralytics für Echtzeit-KI.
Ein Convolutional Neural Network (CNN) ist eine spezielle Deep-Learning-Architektur, die für die Verarbeitung von Daten mit einer gitterartigen Topologie, insbesondere digitalen Bildern, entwickelt wurde. Inspiriert von der biologischen Struktur des visuellen Kortex sind CNNs in einzigartiger Weise in der Lage, räumliche Beziehungen innerhalb der Eingabedaten zu bewahren. Im Gegensatz zu herkömmlichen neuronalen Netzen, die ein Bild zu einer langen Liste von Zahlen verflachen, analysieren CNNs kleine, sich überlappende Bereiche eines Bildes, um automatisch Hierarchien von Merkmalen zu lernen – von einfachen Kanten und Texturen bis hin zu komplexen Formen und Objekten. Diese Fähigkeit macht sie zur grundlegenden Technologie hinter modernen Computer-Vision-Systemen (CV).
Die Stärke eines CNN liegt in seiner Fähigkeit, ein komplexes Bild in eine Form zu reduzieren, die leichter zu verarbeiten ist, ohne dabei Merkmale zu verlieren, die für eine gute Vorhersage entscheidend sind. Dies wird durch eine Pipeline aus verschiedenen Schichten erreicht, die das Eingabevolumen in eine Ausgabeklasse oder einen Ausgabewert umwandeln:
CNNs haben Industrien transformiert, indem sie visuelle Aufgaben mit übermenschlicher Genauigkeit automatisieren.
Während CNNs lange Zeit der Standard für Bildverarbeitungsaufgaben waren, ist eine neuere Architektur namens Vision Transformer (ViT) entstanden.
Moderne Bibliotheken machen die Verwendung von CNN-basierten Modellen einfach. Die ultralytics Das Paket bietet Zugriff
auf hochmoderne Modelle wie YOLO26, die über hochoptimierte CNN-Architekturen für schnelle Inferenz verfügen.
Das folgende Beispiel zeigt, wie ein vortrainiertes CNN-Modell geladen und eine Vorhersage durchgeführt wird:
from ultralytics import YOLO
# Load a YOLO26 model, which uses an advanced CNN architecture
model = YOLO("yolo26n.pt")
# Run inference on an image to identify objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the prediction results
results[0].show()
Die Entwicklung von CNNs wird durch ein robustes Ökosystem von Open-Source-Tools unterstützt. Ingenieure verwenden in der Regel Frameworks wie PyTorch oder TensorFlow , um benutzerdefinierte Architekturen zu erstellen. Diese Bibliotheken bieten die für Faltung und Backpropagation erforderlichen tensor .
Für Teams, die den Lebenszyklus von Computer-Vision-Projekten optimieren möchten – von der Datenerfassung bis zur Bereitstellung – bietet Ultralytics eine umfassende Lösung. Sie vereinfacht komplexe Arbeitsabläufe, sodass sich Entwickler auf die Anwendung von CNNs zur Lösung von Geschäftsproblemen konzentrieren können, anstatt sich um die Verwaltung der Infrastruktur zu kümmern. Darüber hinaus können Modelle in Formate wie ONNX oder TensorRT exportiert werden, um eine leistungsstarke Bereitstellung auf Edge-Geräten zu ermöglichen .