Glossário

Conjunto de modelos

Aumente a precisão e a robustez do modelo com conjuntos de modelos. Explore técnicas como bagging, boosting, stacking e aplicações no mundo real.

Um conjunto de modelos é uma técnica de aprendizagem automática (ML) que combina as previsões de dois ou mais modelos individuais para produzir uma única previsão final, frequentemente superior. O princípio fundamental baseia-se na ideia da "sabedoria da multidão": ao agregar as "opiniões" de vários modelos diferentes, o conjunto pode compensar os erros individuais ou os enviesamentos de qualquer modelo individual, conduzindo a uma maior precisão, maior robustez e menor risco de sobreajuste. Esta abordagem é uma pedra angular do ML de elevado desempenho e é frequentemente utilizada para ganhar concursos de ciência de dados.

Como funcionam os conjuntos de modelos

A eficácia de um conjunto de modelos depende da diversidade dos modelos que o constituem. Se todos os modelos cometerem os mesmos erros, a sua combinação não traz qualquer benefício. Por conseguinte, a diversidade é incentivada através da formação de modelos em diferentes subconjuntos de dados de formação, da utilização de diferentes algoritmos ou da inicialização de modelos com diferentes parâmetros.

As técnicas mais comuns para criar e combinar conjuntos incluem:

  • Bagging (Bootstrap Aggregating): Envolve o treino de várias instâncias do mesmo modelo em diferentes subconjuntos aleatórios dos dados de treino. A previsão final é normalmente uma média ou um voto maioritário de todas as previsões do modelo. O Random Forest é um exemplo clássico de um conjunto baseado em ensacamento.
  • Boosting: Os modelos são treinados sequencialmente, com cada novo modelo a concentrar-se na correção dos erros cometidos pelos seus antecessores. Isto resulta num modelo composto poderoso e altamente preciso. Os algoritmos de reforço populares incluem AdaBoost e Gradient Boosting, com implementações como XGBoost e LightGBM.
  • Empilhamento: Este método envolve o treino de vários modelos diferentes (por exemplo, uma rede neural, uma máquina de vectores de suporte e uma árvore de decisão) e a utilização de outro modelo, denominado meta-aprendiz, para combinar as suas previsões e produzir o resultado final.

Conceitos relacionados

É útil distinguir um conjunto de modelos de termos relacionados:

  • Métodos de conjunto: Esta é a categoria teórica mais alargada de técnicas (como bagging e boosting) utilizadas na aprendizagem automática. Um "conjunto de modelos" é o artefacto concreto - a coleção específica de modelos treinados - criado pela aplicação de um método de conjunto.
  • Mistura de Peritos (MoE): Ao contrário de um conjunto típico que combina os resultados de todos os modelos, um MdE utiliza uma rede de gating para selecionar dinamicamente o modelo "especializado" mais adequado para uma determinada entrada. Um MoE escolhe um perito, enquanto um conjunto consulta todos eles.

Aplicações no mundo real

Os conjuntos de modelos são amplamente utilizados em vários domínios para alcançar o desempenho mais avançado.

  1. Deteção de objectos em visão computacional: Em sistemas críticos para a segurança, como os veículos autónomos, ou para tarefas de elevado valor, como a vigilância de segurança, os conjuntos podem melhorar a fiabilidade. Por exemplo, um conjunto pode combinar diferentes modelos de deteção de objectos, tais como diferentes versões do Ultralytics YOLO, como o YOLOv8 e o YOLOv10, ou modelos treinados com diferentes estratégias de aumento de dados. O Guia de combinação de modelos YOLOv5 demonstra como isso pode melhorar a precisão da deteção. Até mesmo técnicas como Test-Time Augmentation (TTA) podem ser consideradas uma forma de ensembling, uma vez que calculam a média das previsões em várias versões aumentadas de uma imagem.
  2. Diagnóstico médico: Os conjuntos são cruciais na análise de imagens médicas para tarefas como o diagnóstico de doenças a partir de raios X, ressonâncias magnéticas ou lâminas de patologia. Uma CNN pode ser excelente na deteção de determinadas anomalias, enquanto outra é melhor noutras. Ao agrupar as suas previsões, uma ferramenta de diagnóstico pode alcançar uma maior precisão e fiabilidade, o que é fundamental para aplicações como a deteção de tumores.

Embora poderosos, os conjuntos aumentam a complexidade e as necessidades computacionais, tanto para a formação como para a implementação de modelos. A gestão de vários modelos requer mais recursos, engenharia cuidadosa e práticas robustas de MLOps. No entanto, os ganhos significativos de desempenho muitas vezes justificam esses custos em aplicações críticas. Plataformas como o Ultralytics HUB podem simplificar o gerenciamento de vários modelos criados usando estruturas como PyTorch ou TensorFlow.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Ligue-se, colabore e cresça com inovadores globais

Aderir agora
Ligação copiada para a área de transferência