Data Labeling
Aprende os fundamentos da rotulagem de dados para machine learning. Descobre tipos principais como deteção de objetos e como acelerar fluxos de trabalho usando o Ultralytics YOLO26.
A rotulagem de dados é o processo fundamental de identificar dados brutos—como imagens, quadros de vídeo, texto ou áudio—e adicionar tags informativas ou metadados para fornecer contexto. No domínio do machine learning (ML), os algoritmos não conseguem compreender inerentemente o mundo físico; eles precisam de um "professor" para guiá-los. Essa orientação vem na forma de conjuntos de dados rotulados usados durante o supervised learning. Os rótulos servem como o ground truth, representando as respostas corretas que o modelo se esforça para prever. Quer estejas a treinar um classificador simples ou uma arquitetura complexa como o Ultralytics YOLO26, a precisão, consistência e qualidade destes rótulos são os principais determinantes do sucesso de um modelo.
Link to this sectionRotulagem de dados vs. Anotação de dados#
Embora os termos sejam frequentemente usados de forma intercambiável em conversas casuais, existe uma distinção subtil que vale a pena notar. "Rotulagem de dados" refere-se geralmente ao ato abrangente de atribuir uma categoria ou tag a um dado (por exemplo, marcar um email como "spam"). Em contraste, a data annotation é frequentemente mais específica para computer vision (CV), envolvendo a delimitação precisa de objetos usando caixas delimitadoras (bounding boxes), polígonos ou pontos-chave. No entanto, na maioria dos fluxos de trabalho de ML operations (MLOps), ambos os termos descrevem a criação de training data de alta qualidade.
Link to this sectionPrincipais tipos em Visão Computacional#
O método de rotulagem muda com base na tarefa que o modelo deve executar. Os tipos comuns incluem:
- Image Classification: Atribuir um único rótulo a uma imagem inteira, como identificar uma condição meteorológica como "nublado" ou "ensolarado".
- Object Detection: Desenhar bounding boxes 2D em torno de objetos distintos para ensinar ao modelo o que é o objeto e onde ele está localizado.
- Instance Segmentation: Criar máscaras perfeitas ao nível do pixel ou polygons em torno de objetos, o que é essencial para determinar formas e limites precisos.
- Pose Estimation: Marcar keypoints específicos num sujeito, como articulações esqueléticas, para analisar movimento ou postura.
Link to this sectionAplicações no Mundo Real#
A utilidade da rotulagem de dados estende-se a praticamente todas as indústrias que empregam IA.
-
Veículos Autónomos: Carros autónomos dependem de enormes conjuntos de dados onde cada veículo, peão, sinal de trânsito e marcador de faixa é meticulosamente rotulado. Estes dados rotulados permitem que o sistema de perceção navegue em ambientes complexos com segurança. As empresas de autonomous vehicle investem pesadamente na rotulagem ao nível do pixel para garantir a conformidade de segurança.
-
Agricultura de Precisão: Na agricultura moderna, a AI in agriculture é usada para detetar doenças nas culturas ou monitorizar fases de crescimento. Os agricultores usam modelos treinados em imagens rotuladas de folhas "saudáveis" versus "doentes" para automatizar o tratamento, reduzindo o uso de químicos e aumentando o rendimento.
Link to this sectionO fluxo de trabalho de rotulagem#
Criar um conjunto de dados rotulado é frequentemente a parte que mais consome tempo num projeto de IA. O processo envolve tipicamente uma abordagem "Human-in-the-Loop" (HITL), onde anotadores humanos verificam os rótulos para garantir alta precisão. Os fluxos de trabalho modernos aproveitam ferramentas como a Ultralytics Platform, que simplifica a gestão de conjuntos de dados e permite que as equipas colaborem nas anotações. Técnicas avançadas como active learning também podem ser empregadas, onde um modelo pré-rotula os dados e os humanos apenas corrigem as previsões de baixa confiança, acelerando significativamente o processo.
O exemplo a seguir demonstra como usar um modelo YOLO26 pré-treinado para gerar automaticamente rótulos (auto-rotulagem) para uma nova imagem, que podem então ser corrigidos por humanos:
from ultralytics import YOLO
# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")
# Run inference on an image to detect objects
results = model("https://ultralytics.com/images/bus.jpg")
# Save the detection results to a text file in standard YOLO format
# This file can now be used as a starting point for data labeling
results[0].save_txt("bus_labels.txt")





