Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

PyTorch

Descubra PyTorch, el marco de aprendizaje automático flexible Python que impulsa innovaciones de IA como Ultralytics YOLO. ¡Construya de forma más rápida e inteligente hoy mismo!

PyTorch is an open-source machine learning library primarily developed by Meta AI that has become a cornerstone for researchers and developers in the field of deep learning. Known for its flexibility and ease of use, it allows users to build and train complex neural networks using a dynamic computational graph. This feature, often referred to as "eager execution," enables code to be evaluated immediately, making debugging and prototyping significantly more intuitive compared to frameworks that rely on static graph definitions. It integrates seamlessly with the Python programming language, feeling like a natural extension of standard scientific computing tools.

Core Mechanics and Significance

At the heart of this framework are tensors, which are multi-dimensional arrays similar to those found in the NumPy documentation. However, unlike standard arrays, PyTorch tensors are designed to leverage GPU acceleration provided by NVIDIA CUDA. This hardware acceleration is critical for the massive parallel processing required to train modern artificial intelligence (AI) models efficiently.

The library supports a vast ecosystem of tools for computer vision (CV) and natural language processing. By providing a rich set of pre-built layers, optimizers, and loss functions, it simplifies the process of creating algorithms for tasks like image classification and sequence modeling.

Aplicaciones en el mundo real

La versatilidad de este marco ha llevado a su adopción en diversos sectores para soluciones de IA de gran impacto:

  1. Autonomous Vehicles: Industry leaders leverage PyTorch to build deep learning models that process video feeds from car cameras. These models perform real-time object detection to identify lanes, signs, and pedestrians, enabling safer navigation.
  2. Medical Diagnostics: Researchers use the framework to develop advanced healthcare applications. For instance, it powers systems that analyze MRI scans or X-rays to assist doctors in detecting tumors via precise image segmentation.

Comparación con herramientas relacionadas

Para comprender mejor su función, resulta útil distinguir PyTorch otras herramientas comunes en la pila de IA:

  • Vs. TensorFlow: Desarrollado por Google, TensorFlow se basaba TensorFlow en gráficos computacionales estáticos, lo que dificultaba la depuración, pero optimizaba la implementación. Aunque ambos marcos han convergido en cuanto a características, PyTorch suele PyTorch el preferido para la creación rápida de prototipos y la investigación debido a su interfaz intuitiva.
  • Vs. OpenCV: OpenCV una biblioteca centrada en funciones tradicionales de procesamiento de imágenes (como el cambio de tamaño, el filtrado y la conversión de color) más que en el entrenamiento de redes neuronales. En un flujo de trabajo típico, los desarrolladores utilizan OpenCV el preprocesamiento de datos antes de introducir las imágenes en un PyTorch para su análisis.

Integración con Ultralytics

Toda la familia Ultralytics , incluidos el innovador YOLO26 y el ampliamente utilizado YOLO11, está construida de forma nativa en PyTorch. Esta base garantiza que los usuarios se beneficien de la velocidad, la estabilidad y el amplio soporte de la comunidad del marco. Ya sea realizando aprendizaje por transferencia en datos de entrenamiento personalizados o exportando modelos para dispositivos periféricos, la arquitectura subyacente se basa en PyTorch y gradientes PyTorch .

La próxima Ultralytics simplifica aún más esta experiencia, proporcionando una interfaz unificada para gestionar el abastecimiento, el entrenamiento y la implementación de conjuntos de datos sin necesidad de escribir un extenso código repetitivo.

El siguiente ejemplo muestra cómo verificar GPU y ejecutar la inferencia utilizando un YOLO , mostrando cómo el marco maneja la aceleración del hardware en segundo plano:

import torch
from ultralytics import YOLO

# Check if CUDA (GPU) is available for PyTorch acceleration
device = "cuda" if torch.cuda.is_available() else "cpu"
print(f"PyTorch is using device: {device}")

# Load a YOLO26n model (built on PyTorch)
model = YOLO("yolo26n.pt")

# Perform object detection on an image
# PyTorch handles tensor operations and moves data to the GPU automatically
results = model("https://ultralytics.com/images/bus.jpg", device=device)

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora