Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Convolution

Explora los fundamentos de la convolución en visión por computadora y deep learning. Aprende cómo los núcleos (kernels) y los mapas de características potencian Ultralytics YOLO26 para tareas en tiempo real.

La convolución es una operación matemática fundamental que sirve como bloque de construcción principal de los sistemas modernos de visión artificial (CV) y aprendizaje profundo (DL). En el contexto del procesamiento de imágenes, la convolución implica deslizar un pequeño filtro —a menudo llamado kernel— sobre una imagen de entrada para crear un mapa de características significativas. Este proceso permite a los modelos de inteligencia artificial (IA) aprender e identificar automáticamente patrones como bordes, texturas y formas sin intervención humana. A diferencia del aprendizaje automático (ML) tradicional, que a menudo requiere extracción de características manual, la convolución permite que las redes construyan una comprensión jerárquica de los datos visuales, comenzando por líneas simples y progresando hacia objetos complejos como rostros o vehículos.

Link to this sectionCómo funciona la convolución#

La operación funciona pasando un filtro sobre los datos de entrada, realizando una multiplicación elemento a elemento y sumando los resultados para producir un único valor para cada posición. Esta salida se conoce como mapa de características.

  • El kernel: Se trata de una pequeña matriz de números (pesos) que detecta características específicas. Por ejemplo, un operador de Sobel es un tipo específico de kernel utilizado para detectar bordes verticales u horizontales.
  • Ventana deslizante: El kernel se mueve a través de la imagen usando un tamaño de paso definido llamado "stride". Este proceso de filtrado espacial preserva la relación entre píxeles, lo cual es crucial para comprender las imágenes.
  • Jerarquía de capas: En arquitecturas profundas como las redes neuronales convolucionales (CNN), las capas iniciales capturan detalles de bajo nivel, mientras que las capas más profundas los combinan en conceptos de alto nivel.

Link to this sectionConvolución frente a conceptos relacionados#

Para comprender completamente la convolución, resulta útil distinguirla de términos similares que se encuentran a menudo en la literatura sobre redes neuronales (NN):

  • Correlación cruzada frente a convolución: Matemáticamente, la verdadera convolución implica invertir el kernel antes de aplicarlo. Sin embargo, la mayoría de los marcos de trabajo de aprendizaje profundo, incluida la biblioteca PyTorch, implementan la correlación cruzada (deslizamiento sin inversión) pero la etiquetan como "convolución" porque los pesos se aprenden durante el entrenamiento, lo que hace que la distinción de la inversión sea irrelevante para el rendimiento.
  • Convolución frente a atención: Mientras que la convolución procesa información localmente (píxeles vecinos), el mecanismo de atención permite que un modelo relacione partes distantes de una imagen simultáneamente. Las arquitecturas modernas como YOLO26 suelen utilizar capas convolucionales altamente optimizadas para mantener velocidades de inferencia en tiempo real, ya que las capas de atención pueden ser computacionalmente más pesadas.

Link to this sectionAplicaciones en el mundo real#

La eficiencia de la convolución ha permitido que la IA revolucione diversas industrias al potenciar sistemas de percepción robustos:

  1. Diagnóstico médico: En el campo de la IA en el cuidado de la salud, la convolución ayuda a analizar escáneres de resonancia magnética (MRI) de alta resolución. Al utilizar kernels específicos diseñados para resaltar anomalías, los modelos pueden detectar signos tempranos de tumores o fracturas con una precisión que rivaliza con la de los expertos humanos.

  2. Navegación autónoma: Los vehículos autónomos dependen de la convolución para la detección de objetos en tiempo real. A medida que el coche se mueve, las capas convolucionales procesan las fuentes de vídeo para identificar al instante peatones, marcadores de carril y señales de tráfico, un componente crítico de la seguridad de la IA en automoción.

Link to this sectionEjemplo en Python con Ultralytics#

Puedes inspeccionar las capas convolucionales dentro de modelos de vanguardia utilizando Python. El siguiente ejemplo carga el modelo YOLO26 y verifica que su capa inicial utiliza una operación convolucional estándar, la cual se implementa mediante torch.nn.

import torch.nn as nn
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Access the first layer of the model's backbone
first_layer = model.model.model[0]

# Verify it is a Convolutional layer
if isinstance(first_layer.conv, nn.Conv2d):
    print("Success: The first layer is a standard convolution.")
    print(f"Kernel size: {first_layer.conv.kernel_size}")

Link to this sectionPor qué la convolución es importante para la IA en el borde (Edge AI)#

Las operaciones convolucionales son altamente optimizables, lo que las hace ideales para despliegues de Edge AI donde los recursos computacionales son limitados. Dado que el mismo kernel se comparte en toda la imagen (compartición de parámetros), el modelo requiere mucha menos memoria que las antiguas arquitecturas totalmente conectadas. Esta eficiencia permite que modelos avanzados se ejecuten en teléfonos inteligentes y dispositivos IoT.

Para los equipos que buscan aprovechar estas operaciones para conjuntos de datos personalizados, la plataforma Ultralytics ofrece un entorno fluido para anotar imágenes y entrenar modelos basados en convolución sin necesidad de gestionar infraestructuras complejas. Al utilizar aprendizaje por transferencia, puedes ajustar pesos convolucionales preentrenados para reconocer nuevos objetos con un mínimo de datos de entrenamiento.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático