Glosario

Redes Residuales (ResNet)

Descubra cómo las ResNets revolucionan el aprendizaje profundo al resolver los gradientes que se desvanecen, permitiendo redes ultraprofundas para el análisis de imágenes, el PNL y más.

Las redes residuales, ampliamente conocidas como ResNets, representan un avance fundamental en el campo de la inteligencia artificial (IA) y la visión por ordenador (CV). Introducida en 2015 por investigadores de Microsoft Research, esta arquitectura abordó un reto importante en el aprendizaje profundo (AD) conocido como el problema del gradiente de fuga. Antes de la llegada de ResNet, el aumento de la profundidad de una red neuronal (NN) a menudo daba como resultado en la que, al añadir más capas, aumentaban los errores de entrenamiento. ResNet resolvió este problema introduciendo "conexiones conexiones", que permiten entrenar con éxito redes con cientos o incluso miles de capas manteniendo una alta precisión.

El núcleo de la innovación: Bloques residuales

La característica que define a una ResNet es el bloque residual. En una En una red neuronal convolucional (CNN) tradicional, las capas se apilan secuencialmente y cada una de ellas intenta aprender directamente una correspondencia entre las entradas y las salidas. Sin embargo, a medida que las redes se hacen más profundas, la señal de los datos de entrada puede degradarse antes de llegar al final de la red.

ResNet introduce un "atajo" o conexión de salto que permite añadir la entrada de una capa directamente a su salida. su salida. Este mecanismo básicamente indica a la red que aprenda el "residuo" (la diferencia) entre la entrada y la salida óptima, en lugar de aprender toda la transformación desde cero. la entrada y la salida óptima, en lugar de aprender toda la transformación desde cero. Esta arquitectura conserva el flujo de información y facilita una mejor extracción de características, lo que permite capturar patrones complejos como texturas y formas sin perder los datos de entrada originales. Puede leer el artículo original el documento original Deep Residual Learning for Image Recognition los fundamentos matemáticos.

Por qué ResNet es importante en el aprendizaje automático

ResNet se considera la columna vertebral de muchos sistemas de visión modernos. Su capacidad para entrenar redes muy profundas permite la creación de modelos muy robustos que en conjuntos de datos a gran escala como ImageNet.

La arquitectura es especialmente significativa para aprendizaje por transferencia. Dado que los modelos ResNet han aprendido ricos mapas de características a partir de de datos, pueden ajustarse a tareas específicas con conjuntos de datos relativamente pequeños. Esta versatilidad hace que ResNet una opción estándar para tareas que van desde clasificación de imágenes hasta el análisis vídeo.

Aplicaciones en el mundo real

La estabilidad y profundidad que ofrece ResNet han permitido su uso en entornos críticos y de alto riesgo.

Diagnóstico médico: En el campo de la AI en la atención sanitaria, las arquitecturas ResNet utilizan con frecuencia para análisis de imágenes médicas. Por ejemplo investigadores utilizan modelos ResNet profundos para analizar resonancias magnéticas o radiografías para detección de tumores, donde el modelo debe identificar anomalías mínimas en las estructuras tisulares que podrían pasar desapercibidas para redes menos profundas.
Conducción autónoma: Los vehículos autónomos se basan en sistemas de en tiempo real para navegar con seguridad. Las variantes de ResNet suelen servir como extractor de características para sistemas de detección de objetos que identifican peatones, señales de tráfico y otros vehículos. La profundidad de la red garantiza que el coche pueda reconocer objetos objetos en condiciones meteorológicas y de iluminación variables, un componente clave de la IA en la seguridad del automóvil. la IA en la seguridad del automóvil.

ResNet vs. Otras Arquitecturas

Resulta útil distinguir ResNet de otras arquitecturas comunes que se encuentran en bibliotecas de aprendizaje profundo como PyTorch o TensorFlow:

ResNet vs. VGG: Las redes VGG (Visual Geometry Group) eran populares por su simplicidad, ya que sólo utilizaban 3x3 convoluciones. Sin embargo, los modelos VGG son pesados desde el punto de vista computacional y tienen dificultades para entrenarse con eficacia más allá de 19 capas. ResNet utiliza conexiones de salto para profundizar mucho más (por ejemplo, 50, 101 o 152 capas) con una latencia de inferencia inferior en relación con su profundidad. latencia de inferencia en relación con su profundidad.
ResNet frente a YOLO11: Mientras que ResNet es principalmente una columna vertebral del clasificador, YOLO11 es un detector de objetos de última generación. Sin embargo detectores modernos como YOLO11 incorporan conceptos arquitectónicos desarrollados a partir de ResNet, como las conexiones parciales entre etapas, para garantizar un flujo de gradiente eficiente durante el entrenamiento. para garantizar un flujo de gradiente eficaz durante el entrenamiento.

Aplicación con Ultralytics

Puede aprovechar fácilmente los modelos ResNet para tareas de clasificación utilizando la función ultralytics Paquete Python . Este le permite acceder a los pesos preentrenados y realizar inferencias con un código mínimo.

from ultralytics import YOLO

# Load a pre-trained ResNet50 model capable of classifying images
model = YOLO("resnet50.pt")  # Downloads the model weights automatically

# Perform inference on an image URL
results = model("https://ultralytics.com/images/bus.jpg")

# Display the top classification result
print(f"Top class: {results[0].names[results[0].probs.top1]}")

Para los interesados en comprender la teoría en profundidad, cursos como CS231n de Stanford ofrecen excelentes recursos académicos sobre arquitecturas de CNN. Tanto si está construyendo un simple clasificador como un complejo sistema de fabricación inteligente, comprender ResNet es ResNet es esencial para dominar la visión por ordenador moderna.

Redes Residuales (ResNet)

Entrene los modelosYOLO Ultralytics para agilizar los flujos de trabajo en todos los sectores

Solución de licencias empresariales flexible para impulsar su innovación

Entrene modelos de IA en segundos con Ultralytics YOLO

El núcleo de la innovación: Bloques residuales

Por qué ResNet es importante en el aprendizaje automático

Aplicaciones en el mundo real

ResNet vs. Otras Arquitecturas

Aplicación con Ultralytics

Leer más en esta categoría

Tendencias futuras en la detección de objetos: 7 aspectos clave a tener en cuenta

Mejora de la reidentificación de vehículos con los modelosYOLO Ultralytics

Mejora de la predicción de colisiones con los modelosYOLO Ultralytics

Únase a la comunidad Ultralytics