Glossário

Conjunto de dados de referência

Descobre como os conjuntos de dados de referência impulsionam a inovação da IA, permitindo uma avaliação justa dos modelos, a reprodutibilidade e o progresso na aprendizagem automática.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

Um conjunto de dados de referência é uma coleção normalizada de dados utilizada para avaliar e comparar o desempenho de modelos de aprendizagem automática (ML). Estes conjuntos de dados são cruciais no desenvolvimento da inteligência artificial (IA), fornecendo uma linha de base consistente e objetiva para medir o desempenho de diferentes algoritmos em tarefas específicas. Os investigadores e os programadores utilizam extensivamente conjuntos de dados de referência para testar novos modelos, validar melhorias em relação aos existentes, garantir que os modelos cumprem normas reconhecidas e acompanhar os progressos na comunidade de IA, especialmente em domínios como a visão por computador (CV).

Importância dos conjuntos de dados de referência

Os conjuntos de dados de referência são fundamentais porque estabelecem condições equitativas para a avaliação de modelos. Ao utilizar exatamente os mesmos dados e critérios de avaliação, os investigadores podem comparar de forma direta e justa os pontos fortes e fracos de diferentes modelos em condições idênticas. Esta prática promove a reprodutibilidade da investigação, facilitando a verificação dos resultados e o desenvolvimento do trabalho existente. Os parâmetros de referência ajudam a identificar áreas em que os modelos se destacam ou têm dificuldades, orientando futuras direcções de investigação e esforços de desenvolvimento para a criação de sistemas de IA mais robustos e fiáveis. Servem como marcos, permitindo à comunidade medir o progresso ao longo do tempo.

Principais caraterísticas dos conjuntos de dados de referência

Os conjuntos de dados de referência de elevada qualidade partilham normalmente várias caraterísticas fundamentais:

  • Representatividade: Os dados devem refletir com precisão os cenários do mundo real ou o domínio do problema específico a que o modelo se destina.
  • Tamanho e diversidade: Têm de ser suficientemente grandes e diversificados para permitir uma avaliação significativa e evitar que os modelos se limitem a memorizar os dados(sobreajuste). São essenciais conjuntos de dados de visão computacional de alta qualidade.
  • Anotações claras: Os dados devem ser rotulados de forma precisa e consistente(rotulagem de dados) de acordo com diretrizes bem definidas.
  • Métricas de avaliação padronizadas: Os padrões de referência geralmente vêm com métricas específicas (por exemplo, precisão, mAP, IoU) e protocolos de avaliação para garantir comparações consistentes.
  • Acessibilidade: Devem estar prontamente disponíveis para a comunidade de investigação, muitas vezes através de repositórios públicos ou desafios.

Aplicações de conjuntos de dados de referência

Os conjuntos de dados de referência são amplamente utilizados em várias tarefas de IA e de aprendizagem profunda (DL), incluindo:

Exemplos do mundo real

  1. Comparação de modelos de deteção de objectos: Quando Ultralytics desenvolve um novo modelo como o Ultralytics YOLO11o seu desempenho é rigorosamente testado em conjuntos de dados de referência padrão, como o COCO. Os resultados (como as pontuações mAP) são comparados com versões anteriores (YOLOv8, YOLOv10) e outros modelos de última geração. Estas comparações de modelos ajudam os utilizadores a escolher o melhor modelo para as suas necessidades específicas, quer se trate de investigação académica ou de aplicações comerciais. Plataformas como o Ultralytics HUB permitem aos utilizadores treinar modelos e, potencialmente, compará-los com dados personalizados.
  2. Avançar na condução autónoma: As empresas que desenvolvem tecnologia para veículos autónomos baseiam-se fortemente em referências como o Argoverse ou o nuScenes. Estes conjuntos de dados contêm cenários complexos de condução urbana com anotações detalhadas de carros, peões, ciclistas, etc. Ao avaliarem os seus modelos de perceção nestes benchmarks, as empresas podem medir as melhorias na precisão da deteção, na fiabilidade do seguimento e na robustez geral do sistema, o que é fundamental para garantir a segurança na IA para carros autónomos.

Benchmark vs. Outros conjuntos de dados

É importante distinguir os conjuntos de dados de referência de outras divisões de dados utilizadas no ciclo de vida do ML:

  • Dados de treinamento: Usados para ensinar o modelo, ajustando seus parâmetros com base em exemplos de entrada e seus rótulos correspondentes. Normalmente, esta é a maior parte dos dados. Técnicas como o aumento de dados são frequentemente aplicadas aqui.
  • Dados de validação: Utilizados durante o treinamento para ajustar os hiperparâmetros do modelo (como taxa de aprendizado ou escolhas de arquitetura) e fornecer uma estimativa imparcial da habilidade do modelo durante o ajuste. Ajuda a evitar o sobreajuste aos dados de treino.
  • Dados de teste: Utilizados depois de o modelo estar totalmente treinado para fornecer uma avaliação final e imparcial do seu desempenho em dados não vistos. Os conjuntos de dados de referência servem frequentemente como conjuntos de teste padronizados para comparar diferentes modelos desenvolvidos independentemente.

Embora um conjunto de dados de referência possa ser utilizado como um conjunto de teste, o seu objetivo principal é mais amplo: fornecer um padrão comum para comparação em toda a comunidade de investigação, muitas vezes facilitado por tabelas de classificação públicas associadas a desafios como o ImageNet Large Scale Visual Recognition Challenge (ILSVRC).

Lê tudo