Um conjunto de modelos é uma abordagem de aprendizagem automática (ML) em que vários modelos individuais são estrategicamente combinados para produzir um único resultado preditivo, muitas vezes superior. Em vez de se basear num único modelo, o ensembling tira partido da inteligência colectiva de vários modelos, com o objetivo de melhorar o desempenho geral, aumentar a robustez e reduzir a probabilidade de fazer previsões erradas devido às fraquezas de um único modelo. Esta técnica é uma pedra angular da inteligência artificial (IA) moderna e é amplamente aplicada em vários domínios, incluindo a visão por computador (CV). O agrupamento de modelos insere-se na categoria mais vasta dos métodos de agrupamento.
Como funcionam os conjuntos de modelos
A ideia central do ensembling de modelos é que, ao combinar diversos modelos - modelos treinados de forma diferente ou utilizando algoritmos diferentes - os seus erros individuais podem anular-se mutuamente, conduzindo a uma previsão final mais exacta e fiável. As estratégias comuns para combinar os resultados dos modelos incluem:
- Cálculo da média/votação: Para tarefas de regressão, calcula a média das previsões de modelos individuais. Para tarefas de classificação, a previsão final é determinada por uma votação maioritária (votação difícil) ou pela média das probabilidades previstas (votação suave).
- Bagging (Agregação de bootstrap): Várias instâncias do mesmo modelo de base(árvores de decisão, por exemplo) são treinadas independentemente em diferentes subconjuntos aleatórios dos dados de treino. O algoritmo Random Forest é um exemplo clássico de ensacamento.
- Reforço (boosting): Os modelos são treinados sequencialmente, sendo que cada novo modelo se concentra na correção dos erros cometidos pelos anteriores. Exemplos incluem AdaBoost, Gradient Boosting e XGBoost.
- Empilhamento: As previsões de vários modelos de base diferentes (por exemplo, um SVM, uma rede neural e um modelo k-Nearest Neighbors ) são utilizadas como caraterísticas de entrada para um "meta-modelo" final (frequentemente um modelo mais simples, como a regressão logística) que aprende a melhor forma de combinar estas previsões.
No contexto da aprendizagem profunda, os conjuntos podem envolver a combinação de modelos com diferentes arquitecturas (como uma CNN e um Vision Transformer (ViT)), modelos treinados com diferentes hiperparâmetros ou modelos treinados em diferentes subconjuntos de dados. Técnicas como guardar pontos de controlo do modelo em diferentes épocas e agrupá-los (agrupamento de instantâneos) também podem ser eficazes.
Conjunto de modelos vs. métodos de conjunto
Embora estejam intimamente relacionados, estes termos têm nuances ligeiramente diferentes.
- Métodos de conjunto: Refere-se à ampla categoria de técnicas ou algoritmos (como bagging, boosting, stacking) utilizados para criar e combinar vários modelos. É a metodologia.
- Conjunto de modelos: Refere-se normalmente ao grupo específico de modelos que foram combinados utilizando um método de conjunto. É o próprio modelo composto resultante.
Essencialmente, utiliza métodos de conjunto para criar um conjunto de modelos.
Benefícios e considerações
A utilização de conjuntos de modelos oferece vantagens significativas:
- Desempenho melhorado: Os conjuntos atingem frequentemente uma maior precisão e uma melhor generalização do que qualquer modelo constituinte individual, ganhando frequentemente competições de aprendizagem automática.
- Aumenta a robustez: Ao calcular a média dos desvios ou erros dos modelos individuais, os conjuntos são menos sensíveis a valores atípicos ou a ruído nos dados e menos propensos a sobreajustes.
- Redução de erros: A combinação de diversos modelos ajuda a reduzir o risco de confiar num único modelo defeituoso.
No entanto, há considerações a fazer:
- Aumento da complexidade: Treinar, gerenciar e implantar vários modelos é inerentemente mais complexo do que lidar com um único modelo. A implantação de modelos torna-se mais complexa.
- Custo computacional mais elevado: Treinar vários modelos requer mais recursos computacionais (CPU/GPU) e tempo. A inferência também pode ser mais lenta, uma vez que as previsões de todos os modelos de base têm de ser calculadas e combinadas.
- Interpretabilidade: Compreender por que razão um conjunto faz uma previsão específica pode ser mais difícil do que interpretar um modelo único e mais simples, embora as técnicas de IA explicável (XAI) estejam a evoluir.
Plataformas como o Ultralytics HUB podem ajudar a gerir as complexidades da formação e do acompanhamento de vários modelos, simplificando potencialmente a criação de conjuntos eficazes.
Aplicações no mundo real
Os conjuntos de modelos são amplamente utilizados em vários domínios:
- Deteção de objectos em Visão por Computador: Em tarefas como a condução autónoma ou a vigilância de segurança, diferentes modelos de deteção de objectos (por exemplo, diferentes versões do Ultralytics YOLO como YOLOv8 e YOLOv10, ou modelos como RT-DETR) podem ser combinados. Por exemplo, a combinação de modelos treinados em diferentes aumentos ou em diferentes fases de treino(o aumento do tempo de teste pode ser visto como uma forma de ensembling) pode melhorar a precisão e a robustez da deteção em condições difíceisYOLOv5 Guia de Ensembling de ModelosYOLOv5 ).
- Diagnóstico médico: Os conjuntos podem combinar previsões de diferentes modelos que analisam imagens médicas (como radiografias ou ressonâncias magnéticas) ou dados de pacientes. Um modelo pode ser excelente na deteção de determinadas anomalias, enquanto outro é melhor noutras. A combinação destes modelos pode conduzir a uma ferramenta de diagnóstico mais fiável, crucial para aplicações como a deteção de tumores.
- Previsão financeira: A previsão dos preços das acções ou do risco de crédito envolve frequentemente uma elevada incerteza. O conjunto de modelos treinados em diferentes janelas de dados históricos ou utilizando diferentes indicadores económicos pode fornecer previsões mais estáveis e precisas do que qualquer modelo de previsão individual. Explora mais sobre a IA nas finanças.
- Controlo de qualidade de fabrico: A combinação de modelos que inspeccionam produtos de diferentes ângulos ou que se concentram em diferentes tipos de defeitos pode criar um sistema de inspeção de qualidade mais abrangente do que um único modelo de visão(Computer Vision in Manufacturing).
A montagem de modelos é uma técnica poderosa para alargar os limites de desempenho dos sistemas de ML, tornando-a uma ferramenta valiosa no conjunto de ferramentas do programador de IA.