Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Aprendizado Supervisionado

Descubra como o aprendizado supervisionado impulsiona a IA com dados rotulados, permitindo previsões precisas e aplicações como detecção de objetos e análise de sentimentos.

A aprendizagem supervisionada é um paradigma dominante no domínio da aprendizagem automática (ML), em que um algoritmo é treinado em dados de entrada que foram rotulados com o resultado correto. Ao contrário de outros métodos em que um sistema pode explorar dados de forma autónoma, esta abordagem depende de um "supervisor" - os dados rotulados - paraorientar o processo de aprendizagem. O O objetivo principal é que o modelo aprenda uma função de mapeamento das variáveis de entrada para as variáveis de saída com suficiente O objetivo principal é que o modelo aprenda uma função de mapeamento das variáveis de entrada para as variáveis de saída com precisão suficiente para poder prever resultados para dados novos e não vistos. Esta metodologia serve de base a muitos comerciais aplicações comerciais de Inteligência Artificial (IA) comerciais, desde filtros de spam a sistemas avançados de sistemas avançados de Visão por Computador (CV).

Como funciona o processo

O fluxo de trabalho começa com um conjunto de dados que contém pares de entradas (caraterísticas) e saídas desejadas (rótulos). Esta coleção é normalmente dividida em subconjuntos distintos: dados de treino para ensinar o modelo, dados de validação para afinar os parâmetros, e dados de teste para a avaliação final.

Durante a fase de treino do modelo, o algoritmo processa os dados de dados de entrada e faz uma previsão. Uma fórmula matemática conhecida como função de perda calcula a diferença entre esta previsão e o rótulo real. Para minimizar esse erro, um algoritmo de otimização, como o descida de gradiente, ajusta iterativamente os pesos internos do modelo. Este ciclo continua ao longo de muitas passagens, ou épocas, até que o modelo atinja um desempenho satisfatório sem se ajustar demasiado ao conjunto de treino. Para uma análise mais para um mergulho mais profundo nessa mecânica, você pode explorar o Guia do Scikit-learn sobre aprendizagem supervisionada.

Categorias principais de aprendizagem supervisionada

A maioria dos problemas de aprendizagem supervisionada divide-se em duas categorias principais baseadas no tipo de variável de saída:

  • Classificação de imagens: A variável de saída variável de saída é uma categoria ou classe. O objetivo é prever rótulos discretos, como determinar se um e-mail é "spam" ou "não spam", ou se uma imagem contém um "gato" ou um "cão". As arquitecturas arquitecturas modernas como a Ultralytics YOLO11 são excelentes nestas tarefas de classificação, identificando rapidamente padrões em dados visuais.
  • Regressão: A variável de saída é um valor real contínuo. Os exemplos incluem a previsão de preços de imóveis com base na metragem quadrada ou previsão de tendências do mercado de acções. Pode obter mais informações sobre os fundamentos estatísticos destes métodos em visão geral da IBM sobre análise de regressão.

Implementação de um modelo de classificação

O treino de um modelo supervisionado tornou-se cada vez mais acessível com APIs de alto nível. O seguinte exemplo Python demonstra como treinar um modelo YOLO11 no conjunto de dados MNIST , uma referência padrão para a classificação de dígitos.

from ultralytics import YOLO

# Load a pretrained classification model
model = YOLO("yolo11n-cls.pt")

# Train the model on the MNIST dataset
# Ultralytics handles the download of the 'mnist160' dataset automatically
results = model.train(data="mnist160", epochs=5, imgsz=64)

# Run inference on a sample image to verify the supervised learning
print(model("https://ultralytics.com/images/bus.jpg"))

Aplicações no Mundo Real

A aprendizagem supervisionada potencia tecnologias críticas em vários sectores. Dois exemplos proeminentes incluem:

  1. Veículos autónomos: Os veículos autónomos dependem fortemente de sistemas de deteção de objectos treinados através de aprendizagem supervisionada. Conjuntos de dados anotados que contêm milhares de imagens de peões, semáforos e outros veículos permitem que a IA do automóvel reconheça e localize os perigos em tempo real. Empresas como a NVIDIA utilizam a aprendizagem profunda para processar estas vastas entradas de sensores para uma navegação segura.
  2. Análise de imagens médicas: Na área da saúde, os modelos são treinados em exames rotulados por radiologistas especializados para ajudar no diagnóstico. Por exemplo, um modelo modelo pode aprender a identificar sinais precoces de patologias em radiografias ou ressonâncias magnéticas. Os investigadores utilizam frequentemente recursos como o conjunto de dados de Deteção de Tumores Cerebrais para criar sistemas que apoiam a tomada de decisões clínicas.

Distinguir conceitos relacionados

É importante distinguir a aprendizagem supervisionada de outros paradigmas de aprendizagem automática:

  • Aprendizagem não supervisionada: Ao contrário da aprendizagem supervisionada, este método lida com dados não rotulados. O objetivo é descobrir estruturas ocultas, tais como como agrupar clientes com hábitos de compra semelhantes através de análise de clusters.
  • Aprendizagem por reforço: Em vez de aprender a partir de um conjunto de dados estático de respostas corretas, um agente aprende ao interagir com um ambiente. O agente recebe feedback sob a forma de prémios ou penalizações, um conceito detalhado na Introdução à aprendizagem por reforço de Sutton e Barto.
  • Aprendizagem Semi-Supervisionada: Esta abordagem actua como um meio-termo, utilizando uma pequena quantidade de dados etiquetados juntamente com um conjunto maior de dados não etiquetados para melhorar a eficiência da aprendizagem. para melhorar a eficiência da aprendizagem, frequentemente utilizada quando os dados de etiquetagem são dispendiosos ou demorados.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora