Descubra o aprendizado ativo, um método de machine learning econômico que aumenta a precisão com menos rótulos. Aprenda como ele transforma o treinamento de IA!
A aprendizagem ativa é uma abordagem estratégica em aprendizagem automática (ML) em que o algoritmo seleciona proativamente os pontos de dados mais informativos para rotulagem, em vez de aceitar passivamente um conjunto de dados pré-rotulado. Na aprendizagem supervisionada tradicional, os modelos geralmente requerem grandes quantidades de dados anotados, cuja criação pode ser cara e demorada. A aprendizagem ativa otimiza esse processo identificando exemplos "incertos" ou "difíceis" — aqueles próximos ao limite de decisão ou onde o modelo carece de confiança — e solicitando que anotadores humanos rotulem apenas essas instâncias específicas . Esse ciclo iterativo permite que os modelos alcancem alta precisão com um número significativamente menor de amostras rotuladas, tornando-o altamente eficiente para projetos com orçamentos limitados ou restrições de tempo.
O núcleo da aprendizagem ativa é um ciclo de feedback frequentemente referido como human-in-the-loop. Em vez de treinar uma vez num conjunto de dados estático, o modelo evolui através de ciclos de consulta e atualização.
A aprendizagem ativa é indispensável em setores onde os dados são abundantes, mas a rotulagem requer conhecimento especializado ou custos elevados.
O exemplo a seguir demonstra uma lógica simples de «amostragem de incerteza» usando o Ultralytics . Carregamos um modelo, executamos a inferência nas imagens e sinalizamos aquelas cuja pontuação de confiança está abaixo de um determinado limite para revisão manual.
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# List of unlabeled image paths
unlabeled_images = ["https://ultralytics.com/images/bus.jpg", "https://ultralytics.com/images/zidane.jpg"]
# Run inference
results = model(unlabeled_images)
# Identify samples with low confidence for active learning
uncertain_threshold = 0.6
for result in results:
# Check if any detection confidence is below the threshold
if result.boxes.conf.numel() > 0 and result.boxes.conf.min() < uncertain_threshold:
print(f"Active Learning Query: {result.path} needs human labeling.")
É importante diferenciar a aprendizagem ativa de paradigmas de formação semelhantes:
A implementação eficaz da aprendizagem ativa requer um robusto pipeline de operações de aprendizagem automática (MLOps) . É necessária uma infraestrutura para gerir o controlo de versões de dados, acionar tarefas de retreinamento e fornecer a interface de anotação para humanos. Ferramentas que se integram ao Ultralytics permitem que os utilizadores alternem facilmente entre inferência, curadoria de dados e treinamento. Por exemplo, o uso de scripts de treinamento personalizados permite que os desenvolvedores incorporem rapidamente novos lotes de dados de aprendizagem ativa aos seus YOLO .
Para mais informações sobre estratégias de amostragem, os investigadores costumam consultar pesquisas abrangentes na literatura sobre aprendizagem ativa. Além disso, compreender as métricas de avaliação do modelo é crucial para verificar se o ciclo de aprendizagem ativa está realmente a melhorar o desempenho.