Anotação de dados
O que é a anotação de dados? Saiba como a rotulagem de dados com caixas delimitadoras ou polígonos é essencial para treinar modelos precisos de IA e visão computacional.
A anotação de dados é o processo de rotular ou etiquetar dados em bruto para ajudar os modelos de aprendizagem automática (ML) a compreender e aprender com eles. Este passo fundamental transforma dados não estruturados, como imagens ou vídeos, em informações estruturadas que os algoritmos podem interpretar. No contexto da aprendizagem supervisionada, estas anotações funcionam como a "verdade fundamental" - as respostas corretas que o modelo utiliza para se treinar. A qualidade e a precisão da anotação de dados têm um impacto direto no desempenho e na fiabilidade do modelo de inteligência artificial (IA) resultante. Sem anotações exactas, mesmo os modelos mais avançados não conseguirão aprender padrões de forma eficaz.
O papel da anotação na visão computacional
Na visão computacional (CV), a anotação de dados é fundamental para ensinar os modelos a "ver" e interpretar o mundo. Envolve anotadores humanos que utilizam software especializado para identificar e marcar objectos de interesse nos dados visuais. Existem vários tipos de anotação, cada um deles adequado a diferentes tarefas de CV:
- Anotação da caixa delimitadora: Esta é a forma mais comum, utilizada para a deteção de objectos. Os anotadores desenham caixas rectangulares à volta de objectos individuais e atribuem uma etiqueta de classe (por exemplo, "carro", "pessoa").
- Segmentação poligonal: Para tarefas que requerem maior precisão, como a segmentação de instâncias, os anotadores traçam o contorno exato de cada objeto. Isto permite que o modelo compreenda a forma e os limites específicos de um objeto, mesmo quando os objectos se sobrepõem.
- Segmentação semântica: Este método envolve a classificação de cada pixel de uma imagem numa categoria específica (por exemplo, "céu", "estrada", "edifício"). Ao contrário da segmentação de instâncias, não distingue entre instâncias diferentes da mesma classe de objeto.
- Anotação de pontos-chave: Utilizada para a estimativa de pose, esta técnica envolve a marcação de pontos de interesse específicos (pontos-chave) num objeto, como as articulações de um corpo humano ou os cantos de um rosto.
- Classificação: A forma mais simples, em que a uma imagem inteira é atribuída uma única etiqueta. Esta é a base para as tarefas de classificação de imagens.
A escolha do método de anotação depende dos objectivos específicos do projeto de CV, que são descritos no guia para a definição dos objectivos do projeto.
Aplicações no mundo real
- Veículos autónomos: Os veículos autónomos dependem de modelos treinados com base em dados amplamente anotados. Os anotadores rotulam tudo, desde peões e ciclistas a semáforos, marcações de faixa de rodagem e sinais de trânsito em milhões de imagens e nuvens de pontos LiDAR. Estes dados de treino detalhados permitem que o sistema de perceção do veículo compreenda o seu ambiente e tome decisões de condução seguras. Conjuntos de dados como o Argoverse são cruciais para o desenvolvimento de soluções robustas de IA no sector automóvel.
- Análise de imagens médicas: Na IA para os cuidados de saúde, os radiologistas e especialistas médicos anotam exames médicos como ressonâncias magnéticas, tomografias computorizadas e radiografias para destacar tumores, lesões, fracturas ou outras anomalias. Estes conjuntos de dados anotados, como o conjunto de dados públicos de tumores cerebrais, são utilizados para treinar modelos como o Ultralytics YOLO, que podem ajudar no diagnóstico precoce e no planeamento do tratamento. A Radiological Society of North America (RSNA) fornece vários conjuntos de dados deste tipo para investigação.
Anotação de dados vs. conceitos relacionados
A anotação de dados é frequentemente discutida em conjunto com outras técnicas de preparação de dados, mas têm objectivos diferentes.
- Anotação de dados vs. Etiquetagem de dados: Estes dois termos são frequentemente utilizados de forma indistinta e referem-se ao mesmo processo central. A "anotação" é frequentemente preferida na visão por computador para descrever tarefas mais complexas, como desenhar polígonos ou pontos-chave, enquanto a "rotulagem" pode ser utilizada para tarefas mais simples, como a classificação. No entanto, para todos os efeitos práticos, são sinónimos. Para uma análise aprofundada, pode ler mais no nosso explicador sobre rotulagem de dados para visão computacional.
- Anotação de dados vs. Aumento de dados: A anotação é o processo de criação dos rótulos iniciais da verdade fundamental. O aumento de dados, por outro lado, é uma técnica utilizada após a anotação para aumentar artificialmente o tamanho do conjunto de dados, criando versões modificadas das imagens anotadas (por exemplo, rodando, invertendo ou alterando o brilho).
- Anotação de dados vs. Limpeza de dados: A limpeza de dados envolve a correção de erros, a remoção de duplicados e o tratamento de valores em falta num conjunto de dados para garantir a sua qualidade geral. A limpeza pode ocorrer antes da anotação (por exemplo, remover imagens desfocadas) ou depois (por exemplo, corrigir etiquetas incorrectas), mas é diferente do ato de adicionar novas etiquetas. A elevada qualidade dos dados é essencial para uma anotação eficaz.
O processo de anotação pode ser gerido utilizando várias ferramentas, desde opções de código aberto como o CVAT até plataformas comerciais como o Scale AI e o Labelbox. Plataformas como o Ultralytics HUB fornecem soluções integradas para gerenciar conjuntos de dados, treinar modelos e simplificar todo o fluxo de trabalho, desde a coleta e anotação de dados até a implantação.