Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

PyTorch

Entdecken Sie PyTorch, das flexible, Python Framework für maschinelles Lernen, das KI-Innovationen wie Ultralytics YOLO ermöglicht. Entwickeln Sie noch heute intelligenter und schneller!

PyTorch ein führendes Open-Source-Framework für maschinelles Lernen (ML), das sich zu einem Standardwerkzeug für Forscher und Entwickler beim Aufbau intelligenter Systeme entwickelt hat. Ursprünglich von den Forschern bei Meta AI entwickelt, wird es nun von der unabhängigen PyTorch verwaltet, die ein gemeinschaftsorientiertes Wachstum und Neutralität gewährleistet. Das Framework ist bekannt für seine Flexibilität und sein „Pythonic”-Design und ermöglicht es Benutzern, komplexe neuronale Netzwerkarchitekturen (NN) mit Code zu erstellen, der sich intuitiv anfühlt und sich nahtlos in das breitere Python integrieren lässt.

Das Herzstück der Bibliothek sind Tensoren, bei denen es sich um mehrdimensionale Arrays handelt, ähnlich denen, die in NumPy. Im Gegensatz zu Standard-Arrays können PyTorch jedoch auf einer GPU Graphics Processing Unit) mit NVIDIA-Technologie verarbeitet werden. NVIDIA CUDA Technologie auf einer GPU (Graphics Processing Unit) verarbeitet werden. Diese Fähigkeit beschleunigt die für Deep-Learning-Aufgaben (DL) erforderlichen umfangreichen Matrixberechnungen erheblich und ermöglicht es, Modelle anhand von Millionen von Bildern oder riesigen Mengen an Textdaten effizient zu trainieren.

Kernfunktionen und Vorteile

PyTorch durch mehrere Designentscheidungen aus, die die Produktivität der Entwickler und die Einfachheit der Fehlersuche in den Vordergrund stellen:

  • Dynamische Berechnungsgraphen: Das Framework verwendet einen „Define-by-Run”-Ansatz, was bedeutet, dass die Graphstruktur während der Ausführung des Codes aufgebaut wird. Dies ermöglicht dynamische Änderungen während der Laufzeit, was besonders vorteilhaft für Aufgaben der natürlichen Sprachverarbeitung (Natural Language Processing, NLP) mit Eingaben variabler Länge ist.
  • Automatische Differenzierung: Die autograd Das System berechnet automatisch Gradienten – die für Backpropagation—Vereinfachung der Umsetzung von komplexen Optimierungsalgorithmen ohne manuelle Berechnungen zu erfordern.
  • Umfangreiches Ökosystem: Es unterstützt domänenspezifische Bibliotheken wie TorchVision für die Bildanalyse, TorchAudio für Ton und TorchText für Sprache und bietet vortrainierte Modelle und Datensätze, um die Entwicklung anzukurbeln.
  • Nahtlose Produktionsbereitstellung: Tools wie TorchScript ermöglichen es Entwicklern, Modelle aus einer flexiblen Forschungsumgebung in leistungsstarke Produktionsumgebungen zu übertragen, was eine effiziente Modellbereitstellung auf verschiedenen Plattformen erleichtert.

Anwendungsfälle in der Praxis

Die Vielseitigkeit dieses Frameworks hat dazu geführt, dass es in verschiedenen Branchen für hochwirksame KI-Lösungen eingesetzt wird:

  1. Autonome Fahrzeuge: Branchenführer wie Tesla AI nutzen PyTorch Deep-Learning-Modelle zu entwickeln, die Videofeeds von Autokameras verarbeiten. Diese Modelle führen eine Echtzeit-Objekterkennung durch, um Fahrspuren, Verkehrszeichen und Fußgänger zu identifizieren und so eine sicherere Navigation zu ermöglichen.
  2. Medizinische Diagnostik: Forscher nutzen das Framework, um fortschrittliche Computer-Vision-Anwendungen (CV) für das Gesundheitswesen zu entwickeln. So unterstützt es beispielsweise Systeme, die MRT- oder Röntgenbilder analysieren, um Ärzten bei der Erkennung von Tumoren durch präzise Bildsegmentierung zu helfen.

Vergleich mit verwandten Tools

Um seine Rolle besser zu verstehen, ist es hilfreich, PyTorch anderen gängigen Tools im KI-Stack zu unterscheiden:

  • Im Vergleich zu TensorFlow: Das von Google entwickelte TensorFlow stützte sich TensorFlow auf statische Berechnungsgraphen, was die Fehlersuche erschwerte, aber die Bereitstellung optimierte. Obwohl sich beide Frameworks in ihren Funktionen angeglichen haben, PyTorch aufgrund seiner intuitiven Benutzeroberfläche häufig für Rapid Prototyping und Forschung bevorzugt .
  • Im Vergleich zu OpenCV: OpenCV eine Bibliothek, die sich auf traditionelle Bildverarbeitungsfunktionen (wie Größenänderung, Filterung und Farbkonvertierung) konzentriert und nicht auf das Training neuronaler Netze. In einem typischen Arbeitsablauf verwenden Entwickler OpenCV die Datenvorverarbeitung, bevor sie die Bilder zur Analyse in ein PyTorch einspeisen.

Integration mit Ultralytics

Die gesamte Ultralytics , einschließlich des hochmodernen YOLO26 und des weit verbreiteten YOLO11, basiert nativ auf PyTorch. Diese Grundlage stellt sicher, dass Anwender von der Geschwindigkeit, Stabilität und dem umfangreichen Community-Support des Frameworks profitieren. Ob beim Transfer-Lernen mit benutzerdefinierten Trainingsdaten oder beim Exportieren von Modellen für Edge-Geräte – die zugrundeliegende Architektur basiert auf PyTorch und -Gradienten.

Die kommende Ultralytics vereinfacht diese Erfahrung weiter und bietet eine einheitliche Schnittstelle zur Verwaltung der Beschaffung, Schulung und Bereitstellung von Datensätzen, ohne dass umfangreicher Boilerplate-Code geschrieben werden muss.

Das folgende Beispiel zeigt, wie man GPU überprüft und eine Inferenz mit einem YOLO durchführt, und veranschaulicht, wie das Framework die Hardwarebeschleunigung im Hintergrund handhabt:

import torch
from ultralytics import YOLO

# Check if CUDA (GPU) is available for PyTorch acceleration
device = "cuda" if torch.cuda.is_available() else "cpu"
print(f"PyTorch is using device: {device}")

# Load a YOLO26n model (built on PyTorch)
model = YOLO("yolo26n.pt")

# Perform object detection on an image
# PyTorch handles tensor operations and moves data to the GPU automatically
results = model("https://ultralytics.com/images/bus.jpg", device=device)

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten