Anotação de Dados
O que é anotação de dados? Aprenda como rotular dados com bounding boxes ou polígonos é essencial para treinar modelos de IA e visão computacional precisos.
A anotação de dados é o processo de rotulagem, etiquetagem ou transcrição de dados em bruto para fornecer um contexto que um modelo de
modelo de aprendizagem automática (ML) possa compreender.
Este passo é fundamental para a
aprendizagem supervisionada, em que os algoritmos se baseiam em
exemplos rotulados para aprender padrões e fazer previsões. Os dados anotados servem como
verdade básica, representando a resposta "correta
que o modelo se esforça por reproduzir durante o treino. Sem uma anotação exacta, mesmo as arquitecturas sofisticadas
como a Ultralytics YOLO11 não podem funcionar eficazmente, uma vez que o
o desempenho do modelo está intrinsecamente ligado à qualidade dos seus
dados de treino.
O Papel da Anotação na Visão Computacional
No domínio da visão por computador (CV), a anotação de dados
envolve a marcação de caraterísticas específicas em imagens ou fotogramas de vídeo. Diferentes tarefas requerem estilos de anotação
estilos de anotação distintos, cada um fornecendo um nível único de pormenor ao sistema.
-
Deteção de objectos: Anotadores
desenham caixas delimitadoras 2D à volta de objectos de interesse,
como carros ou peões. Isto ensina ao modelo o que é um objeto e onde está localizado.
-
Segmentação de instâncias:
Esta técnica requer o traçado de polígonos precisos à volta dos objectos. Ao contrário das caixas delimitadoras, a segmentação mapeia a
forma e o contorno exactos de uma entidade, o que é crucial para aplicações como
como a preensão robótica.
-
Estimativa de pose: Os anotadores marcam "pontos-chave" específicos
"pontos-chave" específicos num objeto, como as articulações de um corpo humano (cotovelos, joelhos, ombros). Isto permite
que os modelos possam track movimento e a postura.
-
Caixas delimitadoras orientadas (OBB): Utilizadas para
objectos que não estão alinhados com o eixo da imagem, tais como navios em imagens de satélite ou embalagens numa correia transportadora.
Estas caixas podem rodar para se adaptarem à orientação do objeto.
-
Classificação de imagens: A forma mais
A forma mais simples de anotação, onde um único rótulo (por exemplo, "ensolarado", "chuvoso") é atribuído a uma
imagem inteira.
As anotações são normalmente guardadas em formatos estruturados como JSON,
XML, ou ficheiros de texto simples (por exemplo, formato YOLO ), que são depois analisados pelo
software de formação.
Aplicações no Mundo Real
A anotação de dados está na base de inúmeras tecnologias modernas, fazendo a ponte entre os sensores brutos e a
e a tomada de decisões inteligentes.
-
Veículos autónomos:
Os veículos autónomos dependem de conjuntos de dados maciços em que todos os marcadores de faixa de rodagem, sinais de trânsito e obstáculos são anotados. Os dados
de câmaras e sensores LiDAR são rotulados para treinar o sistema de perceção do veículo
sistema de perceção do veículo para navegar em segurança. Este nível de pormenor é fundamental para desenvolver soluções robustas de
soluções robustas de IA no sector automóvel.
-
Diagnóstico médico: Em
IA nos cuidados de saúde, os radiologistas anotam
exames de ressonância magnética ou
radiografias para destacar tumores e fracturas. Estas imagens médicas anotadas permitem que os modelos ajudem os médicos, assinalando
potenciais anomalias com elevada sensibilidade.
-
Retalho inteligente: Os sistemas de caixa automatizados utilizam anotações para reconhecer produtos. Ao etiquetar
milhares de artigos de mercearia, os sistemas podem facilitar experiências de compra sem problemas. Ver mais sobre
IA no retalho.
Comparação com Conceitos Relacionados
É útil distinguir a anotação de dados de outros termos frequentemente utilizados no fluxo de trabalho de preparação de dados.
-
Anotação vs. Etiquetagem de dados:
Estes termos são muitas vezes utilizados indistintamente. No entanto, "rotulagem" está frequentemente associada a tarefas simples de
simples de classificação (atribuição de uma categoria), enquanto "anotação" implica frequentemente a geração de metadados mais complexos
mais complexos, como desenhar geometria (polígonos, caixas) ou marcar marcas de tempo em vídeo.
-
Anotação vs. Aumento de dados:
A anotação cria as etiquetas iniciais para um conjunto de dados. O aumento de dados é um processo separado que expande artificialmente
artificialmente esse conjunto de dados, modificando as imagens anotadas existentes (por exemplo, invertendo, rodando ou alterando o brilho)
para melhorar a robustez do modelo.
-
Anotação vs. Aprendizagem ativa:
A aprendizagem ativa é uma estratégia em que o modelo identifica os pontos de dados com os quais está mais confuso e solicita
anotação humana apenas para esses exemplos específicos, optimizando o orçamento de anotação.
Ferramentas e fluxo de trabalho
A criação de anotações de alta qualidade requer frequentemente ferramentas especializadas. Opções de código aberto como
CVAT (Computer Vision Annotation Tool) e
Label Studio fornecem interfaces para desenhar caixas e polígonos. Para operações em grande escala
operações em grande escala, as equipas podem passar para ambientes integrados como a futura Ultralytics Platform, que simplifica o
ciclo de vida, desde o fornecimento de dados até à implementação do modelo.
Depois de os dados serem anotados, podem ser utilizados para treinar um modelo. O exemplo a seguir demonstra como treinar um modelo YOLO11
usando um conjunto de dados definido em um arquivo YAML, que aponta para as imagens e rótulos anotados.
from ultralytics import YOLO
# Load the YOLO11 model (nano version)
model = YOLO("yolo11n.pt")
# Train on the COCO8 dataset, which contains pre-annotated images
# The 'data' argument references a YAML file defining dataset paths and classes
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)