Glossário

Floresta aleatória

Descubra como o Random Forest, um poderoso algoritmo de aprendizagem de conjuntos, se destaca na classificação, regressão e aplicações de IA do mundo real.

O Random Forest é um algoritmo de aprendizagem supervisionada versátil e poderoso, utilizado para tarefas de classificação e regressão na aprendizagem automática (ML). Como um tipo de método de conjunto, funciona através da construção de um grande número de árvores de decisão durante o processo de formação. Para uma tarefa de classificação, o resultado final é a classe selecionada pelo maior número de árvores; para uma tarefa de regressão, é a previsão média das árvores individuais. Esta abordagem de combinação de vários modelos ajuda a melhorar a precisão da previsão e a controlar o sobreajuste, tornando-a mais robusta do que uma única árvore de decisão.

Como funciona a floresta aleatória

A ideia central do Random Forest é introduzir aleatoriedade para construir uma "floresta" de árvores de decisão não correlacionadas. Esta aleatoriedade é injectada de duas formas principais:

  1. Agregação de bootstrap (Bagging): Cada árvore individual na floresta é treinada numa amostra aleatória diferente dos dados de treino. Esta amostragem é feita com substituição, o que significa que alguns pontos de dados podem ser utilizados várias vezes numa única amostra, enquanto outros podem não ser utilizados de todo. Esta técnica é formalmente conhecida como agregação bootstrap.
  2. Aleatoriedade das caraterísticas: Ao dividir um nó em uma árvore de decisão, o algoritmo não procura a melhor divisão entre todas as caraterísticas. Em vez disso, seleciona um subconjunto aleatório de caraterísticas e encontra a melhor divisão apenas dentro desse subconjunto. Isto garante a diversidade das árvores e evita que algumas caraterísticas fortes dominem todas as árvores.

Ao combinar as previsões destas diversas árvores, o modelo reduz a variância e, normalmente, obtém um melhor desempenho do que qualquer árvore isolada. O algoritmo foi desenvolvido por Leo Breiman e Adele Cutler e tornou-se numa ferramenta de eleição para muitos cientistas de dados.

Aplicações no mundo real

O Random Forest é amplamente utilizado em muitos sectores devido à sua simplicidade e eficácia, especialmente com dados tabulares ou estruturados.

  • Serviços financeiros: Os bancos e as instituições financeiras utilizam modelos Random Forest para avaliação do risco de crédito. Ao analisar os dados do cliente, como o rendimento, o historial de empréstimos e a idade, o modelo pode prever a probabilidade de um cliente não pagar um empréstimo. É também uma ferramenta fundamental na IA em finanças para detetar transacções fraudulentas com cartões de crédito.
  • Cuidados de saúde: Na área médica, o Random Forest pode ser utilizado para o diagnóstico de doenças e estratificação do risco do paciente. Por exemplo, pode analisar registos e sintomas de pacientes para prever se um paciente tem uma determinada doença, ajudando os médicos a fazer diagnósticos mais precisos. Pode ler mais sobre aplicações semelhantes na nossa visão geral da IA nos cuidados de saúde.
  • Comércio eletrónico: Os retalhistas online utilizam o Random Forest para criar sistemas de recomendação que sugerem produtos aos utilizadores com base no seu histórico de navegação, padrões de compra e outros comportamentos do utilizador.

Relação com outros modelos

É importante compreender como a Floresta Aleatória se relaciona com outros modelos no panorama da IA.

  • Árvores de decisão: Uma floresta aleatória é fundamentalmente um conjunto de árvores de decisão. Embora uma única árvore de decisão seja simples de interpretar, ela é propensa a se ajustar demais aos dados de treinamento. O Random Forest supera essa limitação calculando a média dos resultados de muitas árvores, criando um modelo mais generalizado.
  • Algoritmos de reforço: Tal como o Random Forest, algoritmos como o XGBoost e o LightGBM também são métodos de conjunto baseados em árvores de decisão. No entanto, eles usam uma estratégia diferente chamada boosting, onde as árvores são construídas sequencialmente, com cada nova árvore tentando corrigir os erros da anterior. Em contrapartida, o Random Forest constrói as suas árvores de forma independente e em paralelo.
  • Modelos de aprendizagem profunda: O Random Forest é altamente eficaz para problemas com dados estruturados. No entanto, para dados não estruturados, como imagens e texto, os modelos de aprendizagem profunda, como as Redes Neuronais Convolucionais (CNN) ou os Transformadores de Visão (ViT), são muito superiores. Na visão computacional, tarefas como a deteção de objectos ou a segmentação de instâncias são melhor tratadas por arquitecturas especializadas como a Ultralytics YOLO11.

Tecnologias e ferramentas

Várias bibliotecas populares de aprendizagem automática fornecem implementações do algoritmo Random Forest. Scikit-learn, uma biblioteca Python amplamente utilizada, oferece uma implementação abrangente do Random Forest com opções para ajuste de hiperparâmetros. Embora potente para muitas tarefas tradicionais de ML, para aplicações de visão computacional de ponta, são frequentemente necessárias arquitecturas e plataformas especializadas que suportem o ciclo de vida dos MLOps. Explore várias soluções Ultralytics que utilizam modelos YOLO para problemas de IA de visão do mundo real.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Ligue-se, colabore e cresça com inovadores globais

Aderir agora
Ligação copiada para a área de transferência