Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Aprendizagem por Transferência

Desbloqueie o poder da aprendizagem por transferência para economizar tempo, impulsionar o desempenho da IA e enfrentar novas tarefas com dados limitados usando modelos pré-treinados.

A aprendizagem por transferência é uma técnica de aprendizagem automática em que um modelo desenvolvido para uma tarefa é reutilizado como ponto de partida para um modelo numa segunda tarefa relacionada. Em vez de treinar um modelo de raiz, o que requer grandes quantidades de dados de treino e recursos computacionais, a aprendizagem por transferência A aprendizagem por transferência aproveita os conhecimentos - tais como mapas de caraterísticas, pesos e padrões - aprendidos numa tarefa de origem. Esta abordagem é a pedra angular da aprendizagem profunda moderna, particularmente na visão computacional (CV), permitindo aos que permite aos programadores obter uma elevada precisão com significativamente menos dados e tempos de formação mais curtos.

Como o Transfer Learning Funciona

O processo baseia-se na capacidade das redes neuronais para aprender representações hierárquicas hierárquicas. Nas camadas iniciais de um modelo, frequentemente designadas por a rede aprende caraterísticas visuais universais como arestas, texturas e formas. Essas caraterísticas são aplicáveis a quase todas as tarefas visuais.

A aprendizagem por transferência envolve normalmente duas fases principais:

  1. Pré-treinamento: Um modelo é treinado num enorme conjunto de dados de referência, como ImageNet (para classificação) ou COCO (para deteção). O modelo pré-treinado O modelo pré-treinado resultante possui uma compreensão robusta das estruturas visuais gerais.
  2. Ajuste fino: O modelo pré-treinado é adaptado a uma tarefa nova e específica. Durante o afinação, o modelo é treinado num conjunto de dados mais pequeno e mais pequeno e específico da tarefa. Muitas vezes, os pesos das camadas iniciais são "congelados" (mantidos estáticos) para preservar caraterísticas aprendidas, enquanto apenas as camadas finais (a cabeça de deteção ou classificador) são actualizadas.

Para um mergulho teórico mais profundo, as Stanford CS231n sobre Aprendizagem por Transferência é um excelente recurso.

Benefícios e relevância

A aprendizagem por transferência responde ao desafio comum da escassez de dados. Ao começar com caraterísticas pré-aprendidas, os modelos evitam evitam o sobreajuste em conjuntos de dados pequenos e convergem muito mais do que os modelos inicializados com pesos aleatórios.

  • Eficiência: Reduz o tempo de formação de dias ou semanas para horas.
  • Desempenho: Frequentemente, os rendimentos são mais elevados Precisão e Precisão e Recuperação porque o modelo começa com uma senso comum" das imagens.
  • Acessibilidade: Permite aos utilizadores criar poderosas aplicações de IA sem necessitarem dos clusters de computação maciça utilizados pelos gigantes da tecnologia.

Aplicações no Mundo Real

A aprendizagem por transferência potencia soluções de IA amplamente utilizadas em vários sectores:

  • Análise de imagens médicas: Os modelos pré-treinados em imagens gerais (como gatos e cães) são aperfeiçoados para detect anomalias em radiografias ou exames de ressonância magnética ou ressonâncias magnéticas. Por exemplo, os investigadores utilizam o YOLO11 para detect tumores cerebrais com elevada precisão, apesar de terem dados médicos rotulados limitados.
  • IA na agricultura: Um modelo geral de deteção de objectos pode ser adaptado para identificar doenças específicas das culturas ou monitorizar o estado das plantas. Isto permite ferramentas de agricultura de precisão que detect frutos maduros ou ervas daninhas em tempo real.

Aprendizagem por Transferência vs. Conceitos Relacionados

É útil distinguir a aprendizagem por transferência de termos semelhantes:

  • vs. Aprendizagem Zero-Shot: A aprendizagem por transferência requer alguns dados rotulados para a nova tarefa para afinar o modelo. Em contraste, tenta classify objectos que o modelo nunca viu antes, baseando-se apenas em descrições semânticas descrições semânticas ou atributos sem quaisquer exemplos de treino.
  • vs. Destilação do conhecimento: A destilação do conhecimento centra-se na compressão do modelo, transferindo o conhecimento de um modelo grande de "professor" para um modelo mais pequeno de "aluno" para melhorar a eficiência. A aprendizagem por transferência centra-se na adaptação ao domínio, transferindo o conhecimento de uma tarefa geral para uma tarefa específica.

Exemplo prático

O seguinte Python exemplo demonstra como aplicar a aprendizagem por transferência utilizando o ultralytics biblioteca. Carregamos um modelo YOLO11 pré-treinado em COCO e afinamo-lo num conjunto de dados de amostra.

from ultralytics import YOLO

# Load a pre-trained model (weights derived from the COCO dataset)
# This acts as our starting point for transfer learning
model = YOLO("yolo11n.pt")

# Fine-tune the model on a new dataset (e.g., COCO8)
# The model adapts its pre-learned features to the specific data
model.train(data="coco8.yaml", epochs=5)

# The updated model can now be used for inference on the new task
model.predict("path/to/image.jpg")

Para mais pormenores sobre a implementação, consulte o Tutorial de aprendizagem por transferênciaPyTorch ou o Guia de aprendizado de transferênciaTensorFlow .

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora