Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

PyTorch

Descubra PyTorch, a estrutura de aprendizado de máquina flexível e Python que alimenta inovações de IA como o Ultralytics YOLO. Construa de forma mais inteligente e rápida hoje mesmo!

PyTorch é um dos principais programas de aprendizagem automática (ML) e (ML) e aprendizagem profunda (DL) que facilita o desenvolvimento de sistemas inteligentes. Originalmente desenvolvido por investigadores da Meta AI, é agora gerido pela FundaçãoPyTorch independente, assegurando crescimento neutro e orientado para a comunidade. Reconhecida pela sua flexibilidade e pelo seu design "Pythonic", permite aos permite aos programadores criar arquitecturas complexas arquitecturas de redes neurais (NN) com código que que parece natural e intuitivo dentro do ecossistemaPython .

No seu núcleo, o quadro funciona com tensores, que são matrizes multidimensionais semelhantes às encontradas no pacote NumPy da biblioteca NumPy. No entanto, ao contrário das matrizes padrão, essas estruturas de dados podem ser processadas em um GPU para acelerar significativamente a velocidade computacional. Esta capacidade é essencial para lidar com o processamento paralelo maciço necessário ao treinar modelos modernos de IA para tarefas como visão por computador (CV) e compreensão da linguagem natural natural.

Principais caraterísticas e vantagens

PyTorch distingue-se de outros frameworks através de um conjunto específico de escolhas de design que priorizam a produtividade do desenvolvedor produtividade do desenvolvedor e a facilidade de depuração:

  • Gráficos computacionais dinâmicos: Ao contrário de frameworks que historicamente usavam grafos estáticos (definindo a rede antes de executá-la), PyTorch emprega uma filosofia "definir por execução". Isso permite que os desenvolvedores modifiquem o gráfico em tempo real, facilitando a depuração e o tratamento de entradas de comprimento variável, o que é particularmente útil no processamento de linguagem natural (NLP).
  • Diferenciação automática: A estrutura inclui um módulo chamado autograd que calcula automaticamente os gradientes - as derivadas matemáticas necessárias para retropropagação. Isto simplifica a implementação de algoritmos de otimização durante a formação.
  • Ecossistema robusto: É suportado por bibliotecas específicas do domínio, tais como TorchVision para tarefas de imagem, que fornece modelos pré-treinados e conjuntos de dados, e TorchAudio para processamento de som.
  • Implementação sem problemas: Com ferramentas como TorchScriptos modelos podem ser transferidos de um ambiente de pesquisa de pesquisa para a implantação em produção sem dependências pesadas, suportando eficiente de modelos.

Aplicações no Mundo Real

A flexibilidade deste quadro levou à sua adoção generalizada em várias indústrias para aplicações de elevado impacto aplicações de grande impacto:

  1. Condução autónoma: Empresas como a Tesla utilizam modelos de aprendizagem profunda modelos de aprendizagem profunda construídos em PyTorch para processar feeds de vídeo das câmaras dos veículos. Estes modelos efectuam a deteção de objectos em tempo real deteção de objectos em tempo real para identificar faixas de rodagem, peões pedestres e outros veículos, permitindo veículos autónomos navegarem em segurança.
  2. Diagnóstico no sector da saúde: No domínio da análise de imagens médicas, os investigadores utilizam a estrutura para treinar modelos que detect anomalias em radiografias e exames de ressonância magnética. Por exemplo, NVIDIA Clara tira partido destas capacidades para ajudar os radiologistas a identificar tumores com maior precisão utilizando segmentação de imagens.

PyTorch vs. outras ferramentas

Para compreender onde PyTorch se enquadra no conjunto de ferramentas do programador, é útil distingui-lo de tecnologias relacionadas:

  • Vs. TensorFlow: Embora ambos sejam estruturas abrangentes de aprendizado profundo, TensorFlow (desenvolvido pelo Google) é historicamente conhecido por gráficos estáticos e fluxos de trabalho de implantação pesada. PyTorch é frequentemente preferido na investigação e na prototipagem rápida devido à sua natureza dinâmica e facilidade de utilização. e facilidade de uso, embora ambos tenham convergido em recursos ao longo do tempo.
  • Vs. OpenCV: OpenCV é uma biblioteca dedicada ao processamento tradicional de imagens (redimensionamento, filtragem, conversão de cores) em vez de aprendizagem profunda. Em um fluxo de trabalho fluxo de trabalho típico, os programadores utilizam OpenCV para pré-processamento de dados antes de alimentar as imagens uma rede neural PyTorch para análise.

Integração com o Ultralytics

Todos Ultralytics YOLO11 são construídos nativamente no PyTorch. Isto garante que os utilizadores beneficiam da velocidade da estrutura e do amplo apoio da comunidade. Quer se envolva em aprendizagem por transferência num conjunto de dados personalizado ou implantar um modelo para computação de ponta, a arquitetura subjacente aproveita os tensores e gradientes PyTorch .

A futura Ultralytics Platform simplifica ainda mais esta experiência, oferecendo uma interface optimizada para treinar e gerir estes modelos sem necessidade de escrever código.

O exemplo seguinte demonstra como carregar um modelo pré-treinado e executar a inferência, mostrando como a estrutura funciona sob o capô para lidar com cálculos pesados:

from ultralytics import YOLO

# Load a standard YOLO11 model (built on PyTorch)
model = YOLO("yolo11n.pt")

# Perform object detection on an image
# PyTorch handles the tensor operations and GPU acceleration automatically
results = model("https://ultralytics.com/images/bus.jpg")

# Print the number of objects detected
print(f"Detected {len(results[0].boxes)} objects.")

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora