Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Voltar para o Glossário da Ultralytics

Catastrophic Forgetting

Descobre como evitar o esquecimento catastrófico em redes neuronais. Explora estratégias de mitigação comprovadas ao treinares os teus modelos Ultralytics YOLO.

O esquecimento catastrófico, frequentemente referido como interferência catastrófica, é um fenômeno amplamente estudado em machine learning onde uma rede neural artificial perde abruptamente informações aprendidas anteriormente ao aprender novas tarefas. Quando um modelo passa por um treinamento sequencial para se adaptar a um novo dataset, algoritmos de otimização que utilizam backpropagation atualizam os model weights. Este processo frequentemente sobrescreve, sem querer, as representações matemáticas necessárias para tarefas anteriores. Consequentemente, um sistema de IA altamente otimizado para seu propósito original pode sofrer uma degradação severa de desempenho nessas tarefas iniciais se for treinado exclusivamente em novos dados sem contra-medidas específicas.

Link to this sectionPor que o Esquecimento Catastrófico acontece#

Em deep learning, o conhecimento de um modelo é armazenado através de uma rede distribuída de neurônios interconectados. Durante o fine-tuning, funções de otimização como Stochastic Gradient Descent ajustam essas conexões para minimizar o erro nos novos dados. Se o novo dataset de treinamento não contiver exemplos das classes originais, o processo de otimização desloca os pesos em direção à nova distribuição de dados, apagando efetivamente a "memória" da distribuição antiga. Estudos recentes sobre mudança estrutural indicam que este colapso interno limita fundamentalmente a capacidade de neural networks modernas de alcançar um lifelong learning semelhante ao humano de forma nativa.

Link to this sectionDiferenciando Conceitos Relacionados#

É crucial contrastar o esquecimento catastrófico com outros conceitos de IA:

  • Catastrophic Forgetting vs. Model Collapse: Enquanto o esquecimento ocorre devido ao aprendizado incremental de novas tarefas, o colapso do modelo é uma degradação gradual de desempenho na mesma tarefa quando um modelo treina recursivamente em dados sintéticos gerados por outros modelos de IA.
  • Catastrophic Forgetting vs. Continual Learning: O aprendizado contínuo (Continual Learning) é a metodologia de pesquisa abrangente que visa resolver o esquecimento catastrófico. Algoritmos de aprendizado contínuo tentam permitir que os modelos adquiram conhecimento sequencialmente sem esquecer.

Link to this sectionExemplos do mundo real#

O esquecimento catastrófico representa um desafio significativo em vários domínios de IA que operam em dynamic real-world environments:

  • Autonomous Systems: Em pipelines de percepção para veículos autônomos, um sistema de computer vision inicialmente treinado para reconhecer pedestres e placas de trânsito padrão pode passar por um fine-tuning para reconhecer novas placas de construção específicas de uma região. Sem salvaguardas, o sistema pode repentinamente ter dificuldade em detectar pedestres de forma confiável, criando um grave risco de segurança.
  • Language and Cognitive AI: Ao personalizar grandes modelos de linguagem para tarefas específicas de domínio — como diagnósticos médicos — o modelo pode esquecer seu alinhamento conversacional ou habilidades gerais de raciocínio. Uma análise comparativa recente sobre LLMs mostra que o fine-tuning padrão em textos altamente especializados frequentemente corrói o safety alignment prévio, fazendo com que os modelos percam suas capacidades primárias de seguir instruções.

Link to this sectionSuperando o Esquecimento Catastrófico#

Engenheiros de IA utilizam várias estratégias para mitigar este problema e manter um plasticity-stability dilemma ideal:

  • Dataset Replay and Merging: O método mais confiável é misturar um subconjunto dos training data originais com os novos dados. Ferramentas como a Ultralytics Platform simplificam o gerenciamento e o versionamento de datasets combinados para garantir que as classes originais sejam efetivamente reproduzidas durante o treinamento.
  • Elastic Weight Consolidation (EWC): Esta técnica de regularização limita atualizações em parâmetros que foram cruciais para tarefas antigas. Ao identificar e preservar esses pesos-chave, os modelos reduzem o esquecimento, como destacado em experimentos recentes sobre como superar o esquecimento em redes.
  • Parameter-Efficient Fine-Tuning (PEFT): Métodos como Low-Rank Adaptation (LoRA) congelam os pesos pré-treinados principais e injetam pequenas matrizes treináveis na rede, evitando que o conhecimento base seja sobrescrito.
  • Freezing Layers: Em ciclos de treinamento mais curtos, congelar as camadas do backbone e do neck garante que os extratores de características principais permaneçam intactos.
  • Gradient-Free Optimization: Frameworks inovadores demonstraram recentemente que métodos baseados em forward pass também podem mitigar o esquecimento de forma eficiente em ambientes onde as atualizações de gradiente são limitadas.

Link to this sectionExemplo de Implementação em Visão Computacional#

Ao adaptar o Ultralytics YOLO para uma nova tarefa de object detection, o congelamento de camadas é uma abordagem eficaz e acessível. O exemplo a seguir demonstra como treinar um modelo Ultralytics YOLO26 em um novo dataset enquanto evita o esquecimento catastrófico ao congelar as 10 camadas iniciais.

from ultralytics import YOLO

# Load a pretrained Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a combined dataset while freezing core backbone layers
# The 'freeze=10' argument prevents catastrophic forgetting of foundational visual features
results = model.train(data="combined_dataset.yaml", epochs=20, freeze=10, lr0=0.001)

# Evaluate the model to ensure it retains performance on old and new tasks
metrics = model.val()

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática