Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Anotação de Dados

O que é anotação de dados? Aprenda como rotular dados com bounding boxes ou polígonos é essencial para treinar modelos de IA e visão computacional precisos.

A anotação de dados é o processo crítico de rotular, marcar ou transcrever dados brutos para fornecer o contexto necessário que um modelo de aprendizagem automática (ML) requer para aprender. Esta etapa é a base da aprendizagem supervisionada, um método em que os algoritmos são treinados em pares de entrada-saída para reconhecer padrões e fazer previsões. As informações rotuladas atuam como a verdade fundamental, representando o resultado ideal que o modelo se esforça para replicar. Sem uma anotação precisa e consistente, mesmo arquiteturas avançadas como o Ultralytics não podem funcionar de forma eficaz, pois a precisão do sistema depende diretamente da qualidade dos seus dados de treino.

Tipos comuns de anotação em visão computacional

No domínio da visão computacional (CV), a anotação de dados envolve marcar características específicas em imagens ou fotogramas de vídeo. O método utilizado depende muito da tarefa específica para a qual o modelo está a ser construído.

  • Detecção de objetos: Os anotadores desenham caixas delimitadoras 2D em torno de objetos de interesse, como veículos ou peões. Isso ensina ao modelo o que é um objeto e onde ele está localizado dentro da cena.
  • Segmentação de instância: Esta técnica envolve traçar polígonos precisos em torno das bordas de um objeto. Ao contrário das caixas simples, a segmentação mapeia a forma e o contorno exatos, o que é vital para tarefas que exigem alta precisão, como a preensão robótica.
  • Estimativa de pose: Os anotadores marcam pontos-chave específicos num objeto, como as articulações do corpo humano (cotovelos, joelhos, ombros). Isso permite que os modelos track , posturas e até analisem o desempenho atlético .
  • Classificação de imagens: Esta é a forma mais simples, em que um único rótulo de categoria (por exemplo, «folha saudável» vs. «folha doente») é atribuído a uma imagem inteira.

Aplicações no Mundo Real

A anotação de dados preenche a lacuna entre os dados brutos dos sensores e a tomada de decisões inteligentes em vários setores.

  1. Agricultura inteligente: Na IA na agricultura, vastos conjuntos de dados de imagens de culturas são anotados para identificar ervas daninhas, pragas ou deficiências nutricionais. Ao treinar modelos com esses dados, os agricultores podem automatizar o monitoramento das culturas e aplicar tratamentos apenas quando necessário, reduzindo o desperdício e melhorando o rendimento.
  2. Condução autónoma: Os carros autônomos dependem de enormes bibliotecas de dados anotados, onde cada marcador de faixa, sinal de trânsito e obstáculo é identificado. Os dados das câmaras e sensores LiDAR são processados para treinar o sistema de percepção do veículo, garantindo que ele possa navegar com segurança em cenários de trânsito complexos.

Distinguir conceitos relacionados

É útil diferenciar a anotação de dados de outros termos frequentemente usados no fluxo de trabalho de preparação de conjuntos de dados.

  • Anotação vs. Rotulagem de dados: Embora frequentemente usados de forma intercambiável, «rotulagem» normalmente refere-se a tarefas de classificação mais simples (atribuir uma etiqueta), enquanto «anotação» implica a geração de metadados mais ricos, como desenhar geometrias complexas ou marcar carimbos de tempo em vídeos.
  • Anotação vs. Aumento de dados: A anotação cria a verdade fundamental inicial. O aumento é um processo subsequente que expande artificialmente o conjunto de dados, aplicando transformações (como rotação ou mudanças de cor) às imagens anotadas existentes para melhorar a robustez do modelo .
  • Anotação vs. Aprendizagem ativa: A aprendizagem ativa é uma estratégia em que o modelo identifica quais pontos de dados específicos considera mais confusos e solicita anotação humana apenas para esses exemplos, otimizando o tempo e o custo do processo de anotação.

Ferramentas e fluxo de trabalho

A criação de anotações de alta qualidade normalmente requer software especializado que exporte dados em formatos padrão, como JSON ou XML. Os fluxos de trabalho modernos estão cada vez mais a migrar para ambientes integrados, como Ultralytics , que simplifica a obtenção de dados, a anotação automática e o treinamento de modelos numa única interface.

Depois que os dados são anotados, eles são referenciados num ficheiro de configuração (geralmente YAML) para treinamento. O exemplo a seguir demonstra como treinar um modelo YOLO26 usando o COCO8 padrão COCO8 , que vem com anotações pré-existentes .

from ultralytics import YOLO

# Load the latest YOLO26 model (nano version)
model = YOLO("yolo26n.pt")

# Train the model using a dataset configuration file
# The YAML file points to the annotated images and labels
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora