Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Catastrophic Forgetting

Descubre cómo prevenir el olvido catastrófico en redes neuronales. Explora estrategias de mitigación probadas al entrenar tus modelos YOLO de Ultralytics.

El olvido catastrófico, frecuentemente denominado interferencia catastrófica, es un fenómeno ampliamente estudiado en aprendizaje automático donde una red neuronal artificial pierde abruptamente información aprendida previamente al aprender nuevas tareas. Cuando un modelo se somete a un entrenamiento secuencial para adaptarse a un nuevo conjunto de datos, los algoritmos de optimización que utilizan backpropagation actualizan los pesos del modelo. Este proceso a menudo sobrescribe inadvertidamente las representaciones matemáticas necesarias para tareas anteriores. En consecuencia, un sistema de IA altamente optimizado para su propósito original puede sufrir una degradación grave del rendimiento en esas tareas iniciales si se entrena exclusivamente con datos nuevos sin contramedidas específicas.

Link to this sectionPor qué ocurre el olvido catastrófico#

En deep learning, el conocimiento de un modelo se almacena en una red distribuida de neuronas interconectadas. Durante el fine-tuning, las funciones de optimización como Stochastic Gradient Descent ajustan estas conexiones para minimizar el error en los nuevos datos. Si el nuevo conjunto de datos de entrenamiento no contiene ejemplos de las clases originales, el proceso de optimización desplaza los pesos hacia la nueva distribución de datos, borrando efectivamente la "memoria" de la distribución antigua. Estudios recientes sobre el cambio estructural indican que este colapso interno limita fundamentalmente la capacidad de las redes neuronales modernas para lograr un aprendizaje continuo similar al humano de forma nativa.

Link to this sectionDiferenciación de conceptos relacionados#

Es crucial contrastar el olvido catastrófico con otros conceptos de IA:

  • Olvido catastrófico frente a colapso del modelo: Mientras que el olvido ocurre debido al aprendizaje incremental de nuevas tareas, el colapso del modelo es una degradación gradual del rendimiento en la misma tarea cuando un modelo se entrena recursivamente con datos sintéticos generados por otros modelos de IA.
  • Olvido catastrófico frente a aprendizaje continuo: El aprendizaje continuo es la metodología de investigación general destinada a resolver el olvido catastrófico. Los algoritmos de aprendizaje continuo intentan permitir que los modelos adquieran nuevos conocimientos secuencialmente sin olvidar.

Link to this sectionEjemplos del mundo real#

El olvido catastrófico plantea un desafío importante en diversos dominios de la IA que operan en entornos dinámicos del mundo real:

  • Sistemas autónomos: En las tuberías de percepción para vehículos autónomos, un sistema de computer vision entrenado inicialmente para reconocer peatones y señales de tráfico estándar podría ajustarse para reconocer nuevas señales de construcción específicas de la región. Sin salvaguardas, el sistema puede dejar de detectar peatones de forma fiable repentinamente, creando un grave riesgo de seguridad.
  • IA de lenguaje y cognitiva: Al personalizar modelos de lenguaje grandes para tareas específicas de un dominio, como el diagnóstico médico, el modelo podría olvidar su alineación conversacional o sus habilidades generales de razonamiento. Un análisis comparativo reciente sobre LLM muestra que el ajuste estándar en textos altamente especializados a menudo erosiona la alineación de seguridad previa, lo que provoca que los modelos pierdan sus capacidades principales de seguir instrucciones.

Link to this sectionCómo superar el olvido catastrófico#

Los ingenieros de IA utilizan varias estrategias para mitigar este problema y mantener un dilema plasticidad-estabilidad óptimo:

  • Replay y fusión de conjuntos de datos: El método más fiable consiste en mezclar un subconjunto de los datos de entrenamiento originales con los nuevos datos. Herramientas como la Ultralytics Platform simplifican la gestión y el control de versiones de conjuntos de datos combinados para garantizar que las clases originales se reproduzcan eficazmente durante el entrenamiento.
  • Elastic Weight Consolidation (EWC): Esta técnica de regularización limita las actualizaciones de los parámetros que fueron cruciales para tareas antiguas. Al identificar y preservar estos pesos clave, los modelos reducen el olvido, como se destaca en experimentos recientes sobre cómo superar el olvido de la red.
  • Parameter-Efficient Fine-Tuning (PEFT): Métodos como Low-Rank Adaptation (LoRA) congelan los pesos preentrenados principales e inyectan matrices pequeñas y entrenables en la red, evitando que se sobrescriba el conocimiento base.
  • Capas de congelación: En ejecuciones de entrenamiento más cortas, congelar las capas del backbone y el cuello garantiza que los extractores de características principales permanezcan intactos.
  • Optimización sin gradientes: Marcos novedosos han demostrado recientemente que los métodos basados en pases hacia adelante (forward pass) también pueden mitigar el olvido de manera eficiente en entornos donde las actualizaciones de gradiente están limitadas.

Link to this sectionEjemplo de implementación en IA de visión#

Al adaptar Ultralytics YOLO para una nueva tarea de object detection, congelar capas es un enfoque eficaz y accesible. El siguiente ejemplo demuestra cómo entrenar un modelo Ultralytics YOLO26 en un nuevo conjunto de datos mientras se previene el olvido catastrófico congelando las primeras 10 capas.

from ultralytics import YOLO

# Load a pretrained Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a combined dataset while freezing core backbone layers
# The 'freeze=10' argument prevents catastrophic forgetting of foundational visual features
results = model.train(data="combined_dataset.yaml", epochs=20, freeze=10, lr0=0.001)

# Evaluate the model to ensure it retains performance on old and new tasks
metrics = model.val()

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático