Glossário

Regressão logística

Descubra o poder da Regressão Logística para a classificação binária. Aprenda as suas aplicações, conceitos-chave e relevância na aprendizagem automática.

A regressão logística é um algoritmo fundamental de aprendizagem supervisionada utilizado para tarefas de classificação em aprendizagem automática (ML). Apesar de o seu nome conter "regressão", é principalmente uma ferramenta para prever um resultado categórico e não um resultado contínuo. O modelo funciona calculando a probabilidade de uma determinada entrada pertencer a uma classe específica. É amplamente valorizado pela sua simplicidade, interpretabilidade e eficiência, tornando-o um excelente modelo de base para muitos problemas de classificação antes de tentar métodos mais complexos.

Como funciona a regressão logística

A regressão logística prevê a probabilidade de um resultado ajustando os dados a uma função logit, frequentemente a função Sigmoid. Esta função pega em qualquer número de valor real e transforma-o num valor entre 0 e 1, que representa a probabilidade. Para uma tarefa de classificação binária (por exemplo, sim/não, verdadeiro/falso), se a probabilidade de saída for superior a um determinado limiar (normalmente 0,5), o modelo prevê uma classe; caso contrário, prevê a outra. O modelo aprende os melhores coeficientes para as caraterísticas de entrada através de um processo de treino que visa minimizar uma função de perda, normalmente utilizando uma técnica de otimização como a descida gradiente.

A principal força deste método reside na sua interpretabilidade. Os coeficientes aprendidos indicam a direção e a força da relação entre cada caraterística de entrada e o resultado, fornecendo informações valiosas sobre os dados. Embora simples, o seu desempenho depende frequentemente de uma boa engenharia de caraterísticas para captar as informações mais relevantes.

Tipos de regressão logística

A Regressão Logística pode ser categorizada com base no número de resultados possíveis:

  • Regressão logística binária: O tipo mais comum, usado quando a variável dependente tem apenas dois resultados possíveis (por exemplo, spam ou não spam).
  • Regressão logística multinomial: Usada quando a variável dependente tem três ou mais categorias não ordenadas (por exemplo, prever a escolha de produto de um cliente a partir de um conjunto de três produtos diferentes). Uma explicação detalhada pode ser encontrada em recursos como o artigo da Wikipedia sobre Logit multinomial.
  • Regressão logística ordinal: Utilizada quando a variável dependente tem três ou mais categorias ordenadas (por exemplo, classificar um serviço como "mau", "razoável" ou "bom").

Aplicações no mundo real

A regressão logística é aplicada em muitos sectores devido à sua eficácia e simplicidade.

  • Análise de imagens médicas: Nos cuidados de saúde, pode ser utilizada para prever a probabilidade de um doente ter uma doença específica com base nos seus sintomas e dados de diagnóstico. Por exemplo, pode modelar a probabilidade de um tumor ser maligno ou benigno com base nas suas caraterísticas, tal como explorado em vários estudos de investigação médica.
  • Deteção de e-mails de spam: É um exemplo clássico em que o modelo classifica os e-mails como "spam" ou "não spam" com base em caraterísticas como a presença de determinadas palavras-chave, informações do remetente e estrutura do e-mail. Esta classificação binária é crucial para filtrar conteúdos não desejados.
  • Pontuação de crédito e previsão financeira: Os bancos e as instituições financeiras utilizam a regressão logística para prever se um candidato a empréstimo entrará em incumprimento ou não, o que ajuda a tomar decisões de empréstimo.

Pontos fortes e pontos fracos

Pontos fortes:

  • Simplicidade e eficiência: É fácil de implementar e computacionalmente pouco dispendioso de treinar, mesmo em grandes conjuntos de dados.
  • Interpretabilidade: Os coeficientes do modelo estão diretamente relacionados com a importância das caraterísticas de entrada, tornando os resultados fáceis de explicar, um componente-chave da IA explicável (XAI).
  • Boa linha de base: Serve como um ponto de partida sólido para qualquer tarefa de classificação de imagens, ajudando a estabelecer uma referência de desempenho.
  • Probabilidades de resultados: Fornece pontuações de probabilidade para os resultados, o que é útil para classificar e ajustar os limiares de decisão.

Pontos fracos:

  • Pressuposto de linearidade: Pressupõe uma relação linear entre as caraterísticas de entrada e as probabilidades logarítmicas do resultado, pelo que pode não captar bem padrões complexos e não lineares.
  • Sensibilidade a valores anómalos: O desempenho pode ser significativamente afetado por valores anómalos nos dados.
  • Propenso a subadaptação: Pode não ser suficientemente potente para conjuntos de dados complexos com limites de decisão altamente não lineares.
  • Requer engenharia de caraterísticas: A sua eficácia depende frequentemente da forma como as caraterísticas de entrada são concebidas e selecionadas.

Comparação com outros algoritmos

A regressão logística é frequentemente comparada com outros algoritmos fundamentais de aprendizagem automática.

  • vs. Regressão Linear: Embora ambas sejam técnicas de regressão, a Regressão Linear é utilizada para prever valores contínuos (por exemplo, o preço de uma casa), enquanto a Regressão Logística é utilizada para tarefas de classificação (por exemplo, prever um resultado binário).
  • vs. Máquinas de vectores de suporte (SVM): As SVM podem lidar com relações não lineares de forma mais eficaz utilizando o truque do kernel e têm como objetivo encontrar um hiperplano de separação ótimo. A regressão logística, por outro lado, centra-se numa abordagem probabilística. As SVMs podem oferecer uma maior precisão, mas podem ser menos interpretáveis.
  • vs. Naive Bayes: Naive Bayes é um modelo generativo, enquanto a Regressão Logística é discriminativa. O Naive Bayes tem frequentemente um bom desempenho com conjuntos de dados mais pequenos ou dados de elevada dimensão (como texto), enquanto a regressão logística pode ser melhor se o pressuposto de independência das caraterísticas do Naive Bayes for violado.
  • vs. Modelos de aprendizagem profunda: Para tarefas complexas como a visão computacional, modelos sofisticados como as Redes Neurais Convolucionais (CNNs) e modelos como o Ultralytics YOLO superam em muito a Regressão Logística. Estes modelos realizam automaticamente a extração de caraterísticas, enquanto a regressão logística requer engenharia manual de caraterísticas. No entanto, a regressão logística é muito mais rápida de treinar e requer significativamente menos dados e recursos computacionais, como GPUs.

As implementações da regressão logística estão amplamente disponíveis em bibliotecas como Scikit-learn e são suportadas pelas principais estruturas de ML, como PyTorch e TensorFlow. Embora não seja o estado da arte para todos os problemas, a sua utilidade como uma linha de base simples, interpretável e eficiente torna-a uma ferramenta indispensável no conjunto de ferramentas do profissional de aprendizagem automática. Ferramentas como o Ultralytics HUB podem ajudar a gerir o ciclo de vida de vários modelos, desde linhas de base simples a soluções complexas de aprendizagem profunda.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Ligue-se, colabore e cresça com inovadores globais

Aderir agora
Ligação copiada para a área de transferência