Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Voltar para o Glossário da Ultralytics

Tensor Parallelism

Aprende como o paralelismo de tensores fragmenta matrizes de pesos entre GPUs para treinar modelos massivos. Explora como difere do paralelismo de dados com o Ultralytics.

Paralelismo de tensores é uma técnica avançada de treinamento distribuído usada em aprendizado de máquina para dividir grandes estruturas matemáticas individuais, ou tensores, entre múltiplos aceleradores de hardware, como GPUs ou TPUs. Ao treinar modelos massivos de deep learning, a contagem de parâmetros pode facilmente exceder a capacidade de memória de um único dispositivo. Em vez de colocar uma camada inteira de rede neural em uma única GPU, o paralelismo de tensores fragmenta as matrizes de pesos e divide as operações matemáticas (como multiplicações de matrizes) entre vários dispositivos em um cluster. Isso permite que o modelo aproveite a memória e o poder de processamento combinados de toda a configuração de hardware, executando computações paralelas em um paradigma de Single-Program Multiple-Data (SPMD) enquanto sincroniza os resultados por meio de interconexões de alta velocidade, como o NVIDIA NVLink.

Link to this sectionComo funciona o paralelismo de tensores#

No núcleo de uma rede neural estão as multiplicações de matrizes. O paralelismo de tensores distribui essas operações dividindo as matrizes por linhas ou colunas. Por exemplo, em uma camada totalmente conectada ou em um mecanismo de atenção de transformer, uma GPU pode calcular a metade esquerda da matriz enquanto outra calcula a metade direita. Após a conclusão das computações paralelas, os dispositivos se comunicam — frequentemente usando rápidas operações coletivas All-Reduce — para agregar os resultados parciais antes de passar o tensor completo para a próxima camada. Avanços acadêmicos recentes em 2025 estão otimizando ainda mais esse processo ao introduzir ativações parcialmente sincronizadas para reduzir o overhead de comunicação que normalmente cria gargalos em grandes clusters de computação.

Link to this sectionDiferenciando técnicas de paralelismo relacionadas#

Entender como o paralelismo de tensores se encaixa no cenário mais amplo da computação distribuída requer diferenciá-lo de outras estratégias comuns:

  • Paralelismo de tensores vs. Paralelismo de modelo: O paralelismo de tensores é uma subcategoria altamente específica do paralelismo de modelo. Enquanto o paralelismo de modelo geral se refere a dividir um modelo entre dispositivos de qualquer maneira, o paralelismo de tensores refere-se estritamente à fragmentação dos tensores individuais dentro de uma única camada.
  • Paralelismo de tensores vs. Paralelismo de pipeline: O paralelismo de pipeline é outra forma de paralelismo de modelo que particiona a rede por profundidade, colocando as primeiras camadas na GPU 0, as próximas na GPU 1, e assim por diante. Isso cria dependências sequenciais conhecidas como bolhas de pipeline. O paralelismo de tensores divide as próprias camadas, executando-as simultaneamente sem atraso sequencial, mas requer uma largura de banda de rede muito maior.
  • Paralelismo de tensores vs. Paralelismo de dados: No paralelismo de dados, o modelo completo é totalmente replicado em cada GPU, e apenas o conjunto de dados de treinamento é dividido entre os dispositivos. Para arquiteturas altamente otimizadas como o Ultralytics YOLO26, que cabem facilmente em GPUs modernas, o paralelismo de dados via DistributedDataParallel do PyTorch é o método padrão. O paralelismo de tensores geralmente só é necessário quando os parâmetros de uma única camada excedem a VRAM do hardware, causando erros de falta de memória (OOM).

Link to this sectionAplicações no Mundo Real#

O paralelismo de tensores é indispensável em infraestruturas modernas de IA, particularmente para arquiteturas de ponta que exigem escala computacional massiva:

Link to this sectionImplementando paralelismo de tensores no PyTorch#

Historicamente, os engenheiros tinham que escrever uma lógica distribuída personalizada complexa para fragmentar tensores. Recentemente, o PyTorch introduziu o DTensor (Tensor Distribuído), simplificando nativamente esse fluxo de trabalho. Abaixo está um exemplo de criação de um tensor fragmentado por linha usando a API de Tensor Distribuído oficial do PyTorch:

import torch
from torch.distributed.device_mesh import init_device_mesh
from torch.distributed.tensor import Shard, distribute_tensor

# Initialize a 1D device mesh across 2 GPUs
mesh = init_device_mesh("cuda", (2,))

# Create a standard PyTorch tensor (e.g., representing a layer's weights)
local_tensor = torch.randn(1024, 1024)

# Distribute the tensor across the GPUs by sharding along the first dimension (row-wise)
# Each GPU now holds a (512, 1024) chunk of the original tensor
distributed_tensor = distribute_tensor(local_tensor, mesh, [Shard(0)])

print(f"Global shape: {distributed_tensor.shape}, Local shape: {distributed_tensor.to_local().shape}")

For edge-optimized vision tasks and rapid model deployment, developers typically rely on the Ultralytics Platform to automatically handle optimal hardware utilization. While multi-billion parameter foundation models require manual tensor parallelism configurations, you can efficiently scale training for models like YOLO26 using simple CLI commands out-of-the-box. This ensures maximum throughput by seamlessly utilizing native data parallelism techniques alongside robust model training tips.

Explore solutions

Real-time AI tailored to your operation

IA na Agricultura

Leve a visão computacional para a agricultura inteligente com os modelos Ultralytics YOLO. Potencialize o monitoramento de colheitas, rastreamento de gado e agricultura de precisão para obter produtividade maior e mais inteligente.

Saiba mais
Real-time AI that works with your operation

IA no setor automotivo

Aplique a visão computacional no setor automotivo com modelos Ultralytics YOLO. A visão computacional eleva a segurança viária, assistência ao motorista e automação de veículos para estradas mais inteligentes.

Saiba mais
Real-time AI that works with your team

IA na saúde

Crie soluções de saúde com modelos Ultralytics YOLO. A IA de visão na saúde impulsiona diagnósticos por imagem mais rápidos, diagnósticos mais inteligentes e monitoramento de pacientes.

Saiba mais
Real-time AI that works with your team

IA no Retalho

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de estoque, monitoramento de prateleiras, gerenciamento de filas e insights de clientes mais inteligentes.

Saiba mais
Real-time AI that works with your team

IA na Robótica

Potencia máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão na robótica impulsiona a navegação autónoma, perceção, seguimento de objetos e controlo em tempo real.

Saiba mais
Real-time AI that works with your team

IA na Manufatura

Otimiza o fabrico com modelos Ultralytics YOLO. A IA de visão impulsiona o controlo de qualidade, deteção de defeitos, conformidade de EPI e automação de linhas de montagem.

Saiba mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos do Ultralytics YOLO. A IA de visão permite inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança do armazém em tempo real.

Saiba mais
Real-time AI tailored to your operation

IA na Agricultura

Leve a visão computacional para a agricultura inteligente com os modelos Ultralytics YOLO. Potencialize o monitoramento de colheitas, rastreamento de gado e agricultura de precisão para obter produtividade maior e mais inteligente.

Saiba mais
Real-time AI that works with your operation

IA no setor automotivo

Aplique a visão computacional no setor automotivo com modelos Ultralytics YOLO. A visão computacional eleva a segurança viária, assistência ao motorista e automação de veículos para estradas mais inteligentes.

Saiba mais
Real-time AI that works with your team

IA na saúde

Crie soluções de saúde com modelos Ultralytics YOLO. A IA de visão na saúde impulsiona diagnósticos por imagem mais rápidos, diagnósticos mais inteligentes e monitoramento de pacientes.

Saiba mais
Real-time AI that works with your team

IA no Retalho

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de estoque, monitoramento de prateleiras, gerenciamento de filas e insights de clientes mais inteligentes.

Saiba mais
Real-time AI that works with your team

IA na Robótica

Potencia máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão na robótica impulsiona a navegação autónoma, perceção, seguimento de objetos e controlo em tempo real.

Saiba mais
Real-time AI that works with your team

IA na Manufatura

Otimiza o fabrico com modelos Ultralytics YOLO. A IA de visão impulsiona o controlo de qualidade, deteção de defeitos, conformidade de EPI e automação de linhas de montagem.

Saiba mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos do Ultralytics YOLO. A IA de visão permite inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança do armazém em tempo real.

Saiba mais
Real-time AI tailored to your operation

IA na Agricultura

Leve a visão computacional para a agricultura inteligente com os modelos Ultralytics YOLO. Potencialize o monitoramento de colheitas, rastreamento de gado e agricultura de precisão para obter produtividade maior e mais inteligente.

Saiba mais
Real-time AI that works with your operation

IA no setor automotivo

Aplique a visão computacional no setor automotivo com modelos Ultralytics YOLO. A visão computacional eleva a segurança viária, assistência ao motorista e automação de veículos para estradas mais inteligentes.

Saiba mais
Real-time AI that works with your team

IA na saúde

Crie soluções de saúde com modelos Ultralytics YOLO. A IA de visão na saúde impulsiona diagnósticos por imagem mais rápidos, diagnósticos mais inteligentes e monitoramento de pacientes.

Saiba mais
Real-time AI that works with your team

IA no Retalho

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de estoque, monitoramento de prateleiras, gerenciamento de filas e insights de clientes mais inteligentes.

Saiba mais
Real-time AI that works with your team

IA na Robótica

Potencia máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão na robótica impulsiona a navegação autónoma, perceção, seguimento de objetos e controlo em tempo real.

Saiba mais
Real-time AI that works with your team

IA na Manufatura

Otimiza o fabrico com modelos Ultralytics YOLO. A IA de visão impulsiona o controlo de qualidade, deteção de defeitos, conformidade de EPI e automação de linhas de montagem.

Saiba mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos do Ultralytics YOLO. A IA de visão permite inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança do armazém em tempo real.

Saiba mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática