Explora PyTorch, la biblioteca central que impulsa Ultralytics . Descubre sus gráficos dinámicos, GPU y cómo crear modelos eficientes de aprendizaje profundo.
PyTorch una biblioteca de aprendizaje automático de código abierto desarrollada principalmente por Meta AI que se ha convertido en una piedra angular para los investigadores y desarrolladores en el campo del aprendizaje profundo. Conocida por su flexibilidad y facilidad de uso, permite a los usuarios crear y entrenar redes neuronales complejas utilizando un gráfico computacional dinámico . Esta característica, a menudo denominada «ejecución entusiasta», permite evaluar el código de forma inmediata, lo que hace que la depuración y la creación de prototipos sean mucho más intuitivas en comparación con los marcos que se basan en definiciones de gráficos estáticos. Se integra a la perfección con el lenguaje Python , lo que la convierte en una extensión natural de las herramientas informáticas científicas estándar.
En el centro de este marco se encuentran los tensores, que son matrices multidimensionales similares a las que se encuentran en la NumPy . Sin embargo, a diferencia de las matrices estándar , PyTorch están diseñados para aprovechar GPU proporcionada por NVIDIA CUDA. Esta aceleración de hardware es fundamental para el procesamiento paralelo masivo necesario para entrenar de manera eficiente los modelos modernos de inteligencia artificial (IA) .
La biblioteca admite un amplio ecosistema de herramientas para la visión artificial (CV) y el procesamiento del lenguaje natural . Al proporcionar un amplio conjunto de capas, optimizadores y funciones de pérdida predefinidos, simplifica el proceso de creación de algoritmos para tareas como la clasificación de imágenes y el modelado de secuencias.
La versatilidad de este marco ha llevado a su adopción en diversos sectores para soluciones de IA de gran impacto:
Para comprender mejor su función, resulta útil distinguir PyTorch otras herramientas comunes en la pila de IA:
Toda la familia Ultralytics , incluidos el innovador YOLO26 y el ampliamente utilizado YOLO11, está construida de forma nativa en PyTorch. Esta base garantiza que los usuarios se beneficien de la velocidad, la estabilidad y el amplio soporte de la comunidad del marco. Ya sea realizando aprendizaje por transferencia en datos de entrenamiento personalizados o exportando modelos para dispositivos periféricos, la arquitectura subyacente se basa en PyTorch y gradientes PyTorch .
La próxima Ultralytics simplifica aún más esta experiencia, proporcionando una interfaz unificada para gestionar el abastecimiento, el entrenamiento y la implementación de conjuntos de datos sin necesidad de escribir un extenso código repetitivo.
El siguiente ejemplo muestra cómo verificar GPU y ejecutar la inferencia utilizando un YOLO , mostrando cómo el marco maneja la aceleración del hardware en segundo plano:
import torch
from ultralytics import YOLO
# Check if CUDA (GPU) is available for PyTorch acceleration
device = "cuda" if torch.cuda.is_available() else "cpu"
print(f"PyTorch is using device: {device}")
# Load a YOLO26n model (built on PyTorch)
model = YOLO("yolo26n.pt")
# Perform object detection on an image
# PyTorch handles tensor operations and moves data to the GPU automatically
results = model("https://ultralytics.com/images/bus.jpg", device=device)