Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

PyTorch

Descubra PyTorch, el marco de aprendizaje automático flexible Python que impulsa innovaciones de IA como Ultralytics YOLO. ¡Construya de forma más rápida e inteligente hoy mismo!

PyTorch es un programa de aprendizaje aprendizaje automático (ML) y aprendizaje profundo (deep learning, DL) que facilita el el desarrollo de sistemas inteligentes. Desarrollado originalmente por investigadores de Meta AI, ahora se rige por la FundaciónPyTorch independiente, lo que garantiza un crecimiento neutral y orientado a la comunidad. Conocido por su flexibilidad y diseño "pitónico", permite a los desarrolladores construir complejas complejas arquitecturas de redes neuronales (NN ) código natural e intuitivo dentro del ecosistemaPython .

En esencia, el marco opera con tensores, que son son matrices multidimensionales similares a las que se encuentran en el programa NumPy de NumPy. Sin embargo a diferencia de las matrices estándar, estas estructuras de datos se pueden procesar en una matriz. GPU para acelerar significativamente velocidad de cálculo. Esta capacidad es esencial para manejar el procesamiento paralelo masivo necesario al entrenar modelos modernos de IA para tareas como visión por computador (CV) y la comprensión del natural.

Principales características y ventajas

PyTorch se distingue de otros frameworks por un conjunto específico de opciones de diseño que priorizan la productividad del desarrollador desarrollador y la facilidad de depuración:

  • Grafos computacionales dinámicos: A diferencia de los frameworks que históricamente utilizaban grafos estáticos (definiendo el grafo antes de ejecutarlo), PyTorch emplea una filosofía de "definición por ejecución". Esto permite a los desarrolladores modificar Esto permite a los desarrolladores modificar el grafo sobre la marcha, lo que facilita la depuración y el manejo de entradas de longitud variable, lo que es particularmente útil en el procesamiento del lenguaje natural (PLN). procesamiento del lenguaje natural (PLN).
  • Diferenciación automática: El marco incluye un módulo denominado autograd que calcula automáticamente los gradientes -las derivadas matemáticas necesarias para retropropagación. Esto simplifica la implementación de algoritmos de optimización durante el entrenamiento.
  • Ecosistema robusto: Cuenta con el apoyo de bibliotecas específicas de dominio como TorchVision para tareas de imagen, que proporciona modelos y conjuntos de datos preentrenados, y TorchAudio para el procesamiento de sonido.
  • Implantación sin fisuras: Con herramientas como TorchScriptlos modelos pueden pasar de un entorno investigación a la producción sin dependencias pesadas, lo que permite un de modelos.

Aplicaciones en el mundo real

La flexibilidad de este marco ha llevado a su adopción generalizada en diversos sectores para aplicaciones de gran impacto de alto impacto:

  1. Conducción autónoma: Empresas como Tesla utilizan modelos learning construidos en PyTorch para procesar los vídeos de las cámaras de los vehículos. Estos modelos detectan detección de objetos para identificar carriles, peatones y otros vehículos, lo que permite vehículos autónomos navegar con seguridad.
  2. Diagnóstico sanitario: En el campo del análisis de imágenes médicas, los el marco para entrenar modelos que detect anomalías en radiografías y resonancias magnéticas. Por ejemplo, NVIDIA Clara aprovecha estas capacidades para ayudar a los radiólogos a a los radiólogos a identificar tumores con mayor segmentación de imágenes.

PyTorch frente a otras herramientas

Para entender qué lugar ocupa PyTorch en el conjunto de herramientas para desarrolladores, resulta útil distinguirlo de otras tecnologías relacionadas:

  • Vs. TensorFlow: Aunque ambos son TensorFlow (desarrollado por Google) es históricamente conocido por sus gráficos estáticos y flujos de trabajo flujos de trabajo de despliegue pesado. PyTorch se prefiere a menudo en la investigación y la creación rápida de prototipos debido a su naturaleza dinámica y facilidad de uso. y facilidad de uso, aunque ambos han convergido en características con el tiempo.
  • Vs. OpenCV : OpenCV es una biblioteca dedicada al procesamiento tradicional de imágenes (redimensionamiento, filtrado, conversión de color) más que al aprendizaje profundo. En un flujo de trabajo desarrolladores utilizan OpenCV para preprocesamiento de datos antes de alimentar una red neuronal PyTorch para su análisis.

Integración con Ultralytics

Todos Ultralytics YOLO11 se construyen de forma nativa en PyTorch. Esto garantiza que los usuarios se beneficien de la velocidad del marco y del amplio apoyo de la comunidad. Ya se trate de en un conjunto de datos personalizado o la arquitectura subyacente aprovecha los tensores y gradientes PyTorch .

La próxima plataformaUltralytics simplifica aún más esta experiencia, ofreciendo una interfaz optimizada para entrenar y gestionar estos modelos sin necesidad de escribir un extenso código código.

En el siguiente ejemplo se muestra cómo cargar un modelo preentrenado y ejecutar la inferencia. opera bajo el capó para manejar cálculos pesados:

from ultralytics import YOLO

# Load a standard YOLO11 model (built on PyTorch)
model = YOLO("yolo11n.pt")

# Perform object detection on an image
# PyTorch handles the tensor operations and GPU acceleration automatically
results = model("https://ultralytics.com/images/bus.jpg")

# Print the number of objects detected
print(f"Detected {len(results[0].boxes)} objects.")

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora