Glossário

PyTorch

Explore PyTorch, a biblioteca central que alimenta Ultralytics . Saiba mais sobre os seus gráficos dinâmicos, GPU e como construir modelos eficientes de aprendizagem profunda.

PyTorch uma biblioteca de aprendizagem automática de código aberto desenvolvida principalmente pela Meta AI que se tornou uma pedra angular para investigadores e programadores na área da aprendizagem profunda. Conhecida pela sua flexibilidade e facilidade de utilização, permite aos utilizadores construir e treinar redes neurais complexas utilizando um gráfico computacional dinâmico . Esse recurso, frequentemente chamado de "execução ansiosa", permite que o código seja avaliado imediatamente, tornando a depuração e a prototipagem significativamente mais intuitivas em comparação com frameworks que dependem de definições gráficas estáticas. Ela se integra perfeitamente à linguagem Python , parecendo uma extensão natural das ferramentas padrão de computação científica.

Mecânica central e significado

No centro dessa estrutura estão os tensores, que são matrizes multidimensionais semelhantes às encontradas na NumPy . No entanto, ao contrário das matrizes padrão, PyTorch são projetados para aproveitar GPU fornecida pela NVIDIA CUDA. Essa aceleração de hardware é fundamental para o processamento paralelo massivo necessário para treinar modelos modernos de inteligência artificial (IA) de maneira eficiente.

A biblioteca suporta um vasto ecossistema de ferramentas para visão computacional (CV) e processamento de linguagem natural . Ao fornecer um rico conjunto de camadas pré-construídas, otimizadores e funções de perda, ela simplifica o processo de criação de algoritmos para tarefas como classificação de imagens e modelagem de sequências.

Aplicações no Mundo Real

A versatilidade desta estrutura levou à sua adoção em diversos setores para soluções de IA de alto impacto:

Veículos autónomos: Os líderes do setor utilizam PyTorch criar modelos de aprendizagem profunda que processam imagens de vídeo das câmaras dos carros. Esses modelos realizam a deteção de objetos em tempo real para identificar faixas, sinais e peões, permitindo uma navegação mais segura.
Diagnóstico médico: Os investigadores utilizam a estrutura para desenvolver aplicações avançadas de cuidados de saúde. Por exemplo, ela alimenta sistemas que analisam exames de ressonância magnética ou raios-X para ajudar os médicos a detetar tumores através da segmentação precisa de imagens.

Comparação com ferramentas relacionadas

Para entender melhor o seu papel, é útil distinguir PyTorch outras ferramentas comuns na pilha de IA:

Vs. TensorFlow: Desenvolvido pela Google, TensorFlow dependia TensorFlow de gráficos computacionais estáticos, o que tornava a depuração mais difícil, mas otimizava a implementação. Embora ambas as estruturas tenham convergido em termos de funcionalidades, PyTorch frequentemente preferido para prototipagem rápida e investigação devido à sua interface intuitiva.
Vs. OpenCV: OpenCV uma biblioteca focada em funções tradicionais de processamento de imagens (como redimensionamento, filtragem e conversão de cores), em vez de treinar redes neurais. Em um fluxo de trabalho típico, os desenvolvedores usam OpenCV o pré-processamento de dados antes de alimentar as imagens em um PyTorch para análise.

Integração com o Ultralytics

Toda a família Ultralytics , incluindo o inovador YOLO26 e o amplamente utilizado YOLO11, é construída nativamente no PyTorch. Essa base garante que os utilizadores se beneficiem da velocidade, estabilidade e amplo suporte da comunidade do framework. Seja realizando aprendizado de transferência em dados de treinamento personalizados ou exportando modelos para dispositivos de ponta, a arquitetura subjacente depende de PyTorch e gradientes PyTorch .

A próxima Ultralytics simplifica ainda mais essa experiência, fornecendo uma interface unificada para gerenciar a obtenção, o treinamento e a implementação de conjuntos de dados sem a necessidade de escrever um código boilerplate extenso.

O exemplo a seguir demonstra como verificar GPU e executar a inferência usando um YOLO , mostrando como a estrutura lida com a aceleração de hardware nos bastidores:

import torch
from ultralytics import YOLO

# Check if CUDA (GPU) is available for PyTorch acceleration
device = "cuda" if torch.cuda.is_available() else "cpu"
print(f"PyTorch is using device: {device}")

# Load a YOLO26n model (built on PyTorch)
model = YOLO("yolo26n.pt")

# Perform object detection on an image
# PyTorch handles tensor operations and moves data to the GPU automatically
results = model("https://ultralytics.com/images/bus.jpg", device=device)

PyTorch

Treine os modelosYOLO Ultralytics para simplificar os fluxos de trabalho em todos os sectores

Solução de licenciamento empresarial flexível para impulsionar sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

Mecânica central e significado

Aplicações no Mundo Real

Comparação com ferramentas relacionadas

Integração com o Ultralytics

Leia mais nesta categoria

12 casos de uso de imagens aéreas com tecnologia de visão computacional

O que é a estimativa de profundidade monocular? Uma visão geral

Uma análise sobre o usoYOLO Ultralytics para deteção de ameaças por IA

Junte-se à comunidade Ultralytics