Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Tensor Parallelism

Aprende cómo el paralelismo de tensores distribuye matrices de pesos entre GPUs para entrenar modelos masivos. Explora cómo se diferencia del paralelismo de datos con Ultralytics.

El paralelismo de tensores es una técnica avanzada de entrenamiento distribuido utilizada en machine learning para dividir estructuras matemáticas individuales grandes, o tensores, entre múltiples aceleradores de hardware como GPUs o TPUs. Al entrenar modelos masivos de deep learning, el número de parámetros puede exceder fácilmente la capacidad de memoria de un solo dispositivo. En lugar de colocar toda una capa de red neuronal en una sola GPU, el paralelismo de tensores fragmenta las matrices de pesos y divide las operaciones matemáticas (como las multiplicaciones de matrices) entre múltiples dispositivos en un clúster. Esto permite que el modelo aproveche la memoria y la potencia de cálculo combinadas de toda la configuración de hardware, ejecutando cálculos paralelos en un paradigma de Single-Program Multiple-Data (SPMD) mientras sincroniza los resultados mediante interconexiones de alta velocidad como NVIDIA NVLink.

Link to this sectionCómo funciona el paralelismo de tensores#

En el núcleo de una red neuronal se encuentran las multiplicaciones de matrices. El paralelismo de tensores distribuye estas operaciones dividiendo las matrices, ya sea por filas o por columnas. Por ejemplo, en una capa totalmente conectada o en un mecanismo de atención de transformer, una GPU podría calcular la mitad izquierda de la matriz mientras otra calcula la mitad derecha. Una vez terminados los cálculos paralelos, los dispositivos se comunican —a menudo utilizando rápidas operaciones colectivas All-Reduce— para agregar los resultados parciales antes de pasar el tensor completo a la siguiente capa. Los avances académicos recientes de 2025 están optimizando aún más este proceso mediante la introducción de activaciones parcialmente sincronizadas para reducir la sobrecarga de comunicación que suele crear cuellos de botella en los grandes clústeres de cálculo.

Link to this sectionDiferenciación de técnicas de paralelismo relacionadas#

Entender cómo encaja el paralelismo de tensores en el panorama más amplio de la computación distribuida requiere diferenciarlo de otras estrategias comunes:

  • Paralelismo de tensores frente a paralelismo de modelos: El paralelismo de tensores es una subcategoría muy específica del paralelismo de modelos. Mientras que el paralelismo de modelos general se refiere a dividir un modelo entre dispositivos de cualquier forma, el paralelismo de tensores se refiere estrictamente a fragmentar los tensores individuales dentro de una sola capa.
  • Paralelismo de tensores frente a paralelismo de canalización: El paralelismo de canalización (pipeline parallelism) es otra forma de paralelismo de modelos que particiona la red por profundidad, colocando las primeras capas en la GPU 0, las siguientes en la GPU 1, y así sucesivamente. Esto crea dependencias secuenciales conocidas como burbujas de canalización. El paralelismo de tensores divide las capas en sí, ejecutándolas simultáneamente sin retraso secuencial, pero requiere un ancho de banda de red mucho mayor.
  • Paralelismo de tensores frente a paralelismo de datos: En el paralelismo de datos, el modelo completo se replica totalmente en cada GPU y solo el conjunto de datos de entrenamiento se divide entre los dispositivos. Para arquitecturas altamente optimizadas como Ultralytics YOLO26, que caben fácilmente en las GPUs modernas, el paralelismo de datos mediante DistributedDataParallel de PyTorch es el método por defecto. El paralelismo de tensores suele ser necesario únicamente cuando los parámetros de una sola capa superan la VRAM del hardware, lo que provoca errores de falta de memoria (OOM).

Link to this sectionAplicaciones en el mundo real#

El paralelismo de tensores es indispensable en las infraestructuras de IA modernas, particularmente para arquitecturas de vanguardia que requieren una escala computacional masiva:

Link to this sectionImplementación del paralelismo de tensores en PyTorch#

Históricamente, los ingenieros tenían que escribir una compleja lógica distribuida personalizada para fragmentar tensores. Recientemente, PyTorch introdujo DTensor (Distributed Tensor), simplificando de forma nativa este flujo de trabajo. A continuación, un ejemplo de creación de un tensor fragmentado por filas utilizando la API oficial de tensores distribuidos de PyTorch:

import torch
from torch.distributed.device_mesh import init_device_mesh
from torch.distributed.tensor import Shard, distribute_tensor

# Initialize a 1D device mesh across 2 GPUs
mesh = init_device_mesh("cuda", (2,))

# Create a standard PyTorch tensor (e.g., representing a layer's weights)
local_tensor = torch.randn(1024, 1024)

# Distribute the tensor across the GPUs by sharding along the first dimension (row-wise)
# Each GPU now holds a (512, 1024) chunk of the original tensor
distributed_tensor = distribute_tensor(local_tensor, mesh, [Shard(0)])

print(f"Global shape: {distributed_tensor.shape}, Local shape: {distributed_tensor.to_local().shape}")

Para tareas de visión optimizadas para el borde y despliegue de modelos rápido, los desarrolladores suelen confiar en la Plataforma Ultralytics para gestionar automáticamente el aprovechamiento óptimo del hardware. Aunque los modelos base de miles de millones de parámetros requieren configuraciones manuales de paralelismo de tensores, puedes escalar eficientemente el entrenamiento para modelos como YOLO26 utilizando sencillos comandos CLI directamente. Esto garantiza el máximo rendimiento mediante la utilización fluida de técnicas nativas de paralelismo de datos junto con sólidos consejos para el entrenamiento de modelos.

Explore solutions

Real-time AI tailored to your operation

IA en la agricultura

Integra la visión artificial en la agricultura inteligente con los modelos Ultralytics YOLO. Potencia el seguimiento de cultivos, el rastreo de ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en la automoción con modelos Ultralytics YOLO. La visión artificial mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI that works with your team

IA en el sector sanitario

Desarrolla soluciones de atención sanitaria con los modelos de Ultralytics YOLO. La IA de visión en el ámbito sanitario potencia imágenes médicas más rápidas, diagnósticos más inteligentes y el seguimiento de pacientes.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La IA de visión potencia el seguimiento de inventario, la monitorización de estanterías, la gestión de colas y conocimientos más inteligentes sobre los clientes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La visión por IA en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con modelos de Ultralytics YOLO. La visión por IA impulsa el control de calidad, la detección de defectos, el cumplimiento de los EPP y la automatización de las líneas de montaje.

Más información
Real-time AI that works with your team

IA en logística

Agiliza la logística con los modelos de Ultralytics YOLO. La visión por IA permite la inspección de paquetes, la clasificación, el seguimiento de vehículos y el monitoreo de la seguridad en el almacén en tiempo real.

Más información
Real-time AI tailored to your operation

IA en la agricultura

Integra la visión artificial en la agricultura inteligente con los modelos Ultralytics YOLO. Potencia el seguimiento de cultivos, el rastreo de ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en la automoción con modelos Ultralytics YOLO. La visión artificial mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI that works with your team

IA en el sector sanitario

Desarrolla soluciones de atención sanitaria con los modelos de Ultralytics YOLO. La IA de visión en el ámbito sanitario potencia imágenes médicas más rápidas, diagnósticos más inteligentes y el seguimiento de pacientes.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La IA de visión potencia el seguimiento de inventario, la monitorización de estanterías, la gestión de colas y conocimientos más inteligentes sobre los clientes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La visión por IA en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con modelos de Ultralytics YOLO. La visión por IA impulsa el control de calidad, la detección de defectos, el cumplimiento de los EPP y la automatización de las líneas de montaje.

Más información
Real-time AI that works with your team

IA en logística

Agiliza la logística con los modelos de Ultralytics YOLO. La visión por IA permite la inspección de paquetes, la clasificación, el seguimiento de vehículos y el monitoreo de la seguridad en el almacén en tiempo real.

Más información
Real-time AI tailored to your operation

IA en la agricultura

Integra la visión artificial en la agricultura inteligente con los modelos Ultralytics YOLO. Potencia el seguimiento de cultivos, el rastreo de ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en la automoción con modelos Ultralytics YOLO. La visión artificial mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI that works with your team

IA en el sector sanitario

Desarrolla soluciones de atención sanitaria con los modelos de Ultralytics YOLO. La IA de visión en el ámbito sanitario potencia imágenes médicas más rápidas, diagnósticos más inteligentes y el seguimiento de pacientes.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La IA de visión potencia el seguimiento de inventario, la monitorización de estanterías, la gestión de colas y conocimientos más inteligentes sobre los clientes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La visión por IA en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con modelos de Ultralytics YOLO. La visión por IA impulsa el control de calidad, la detección de defectos, el cumplimiento de los EPP y la automatización de las líneas de montaje.

Más información
Real-time AI that works with your team

IA en logística

Agiliza la logística con los modelos de Ultralytics YOLO. La visión por IA permite la inspección de paquetes, la clasificación, el seguimiento de vehículos y el monitoreo de la seguridad en el almacén en tiempo real.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático