Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Convolutional Neural Network (CNN)

Explora cómo las Redes Neuronales Convolucionales (CNN) potencian la visión por computadora moderna. Aprende sobre capas, aplicaciones y cómo ejecutar Ultralytics YOLO26 para IA en tiempo real.

Una red neuronal convolucional (CNN) es una arquitectura de aprendizaje profundo especializada diseñada para procesar datos con una topología de tipo rejilla, siendo las imágenes digitales su uso más notable. Inspiradas en la estructura biológica de la corteza visual, las CNN tienen la capacidad única de preservar las relaciones espaciales dentro de los datos de entrada. A diferencia de las redes neuronales tradicionales que aplanan una imagen en una larga lista de números, las CNN analizan regiones pequeñas y superpuestas de una imagen para aprender automáticamente jerarquías de características, desde bordes y texturas simples hasta formas y objetos complejos. Esta capacidad las convierte en la tecnología fundamental de los sistemas modernos de visión por ordenador (CV).

Link to this sectionCómo funcionan las redes neuronales convolucionales#

El potencial de una CNN reside en su capacidad para reducir una imagen compleja a una forma que sea más fácil de procesar sin perder características críticas para obtener una buena predicción. Esto se logra mediante una serie de capas distintas que transforman el volumen de entrada en una clase o valor de salida:

  • Capa de convolución: Este es el componente básico fundamental. Utiliza un conjunto de filtros (o kernels) entrenables que se deslizan sobre la imagen de entrada como una linterna. En cada posición, el filtro realiza una operación matemática llamada convolución, creando un mapa de características que resalta patrones específicos como líneas horizontales o gradientes de color.
  • Función de activación: Tras la convolución, se aplica una función no lineal a la salida. La opción más común es ReLU (Rectified Linear Unit), que convierte en cero los valores de píxel negativos. Esto introduce no linealidad, lo que permite a la red aprender patrones complejos que van más allá de simples relaciones lineales.
  • Capa de pooling: También conocida como submuestreo, esta capa reduce la dimensionalidad de los mapas de características. Técnicas como el max pooling conservan solo las características más importantes (los valores más altos) en una región, lo que reduce la carga computacional y ayuda a prevenir el sobreajuste.
  • Capa totalmente conectada: En la etapa final, las características procesadas se aplanan y se introducen en una red neuronal (NN) estándar. Esta capa utiliza las características de alto nivel identificadas por las capas anteriores para realizar una clasificación o predicción final, como "gato" o "perro".

Link to this sectionAplicaciones en el mundo real#

Las CNN han transformado sectores industriales al automatizar tareas visuales con una precisión sobrehumana.

  • Diagnóstico médico: En la asistencia sanitaria, las CNN ayudan a los radiólogos a identificar anomalías en escáneres médicos más rápido que el ojo humano. Por ejemplo, los modelos de aprendizaje profundo analizan escáneres de resonancia magnética y tomografía computarizada para detectar signos tempranos de tumores o fracturas. Las investigaciones relacionadas con la IA en radiología destacan cómo estas herramientas mejoran la consistencia y la velocidad del diagnóstico.
  • Sistemas autónomos: Los coches autónomos dependen en gran medida de las CNN para percibir su entorno. Modelos como YOLO26 utilizan backbones de CNN eficientes para realizar detección de objetos en tiempo real, identificando peatones, señales de tráfico y otros vehículos para tomar decisiones de conducción en fracciones de segundo.

Link to this sectionCNN frente a Vision Transformers (ViT)#

Aunque las CNN han sido durante mucho tiempo el estándar para las tareas de visión, ha surgido una arquitectura más reciente llamada Vision Transformer (ViT).

  • Las CNN procesan imágenes utilizando características locales y son altamente eficientes en conjuntos de datos más pequeños debido a su "sesgo inductivo" (asumen que los píxeles cercanos están relacionados). Destacan en escenarios que requieren inferencia en tiempo real en dispositivos de borde (edge devices).
  • Los ViT dividen las imágenes en parches y los procesan mediante mecanismos globales de autoatención. Esto les permite capturar dependencias de largo alcance en una imagen, pero normalmente requieren conjuntos de datos masivos y mayor potencia de cómputo para entrenarse eficazmente.

Link to this sectionEjemplo de implementación#

Las librerías modernas hacen que sea sencillo utilizar modelos basados en CNN. El paquete ultralytics proporciona acceso a modelos de última generación como YOLO26, que cuentan con arquitecturas CNN altamente optimizadas para una inferencia rápida.

El siguiente ejemplo demuestra cómo cargar un modelo CNN preentrenado y ejecutar una predicción:

from ultralytics import YOLO

# Load a YOLO26 model, which uses an advanced CNN architecture
model = YOLO("yolo26n.pt")

# Run inference on an image to identify objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the prediction results
results[0].show()

Link to this sectionHerramientas para el desarrollo#

El desarrollo de CNN cuenta con el respaldo de un sólido ecosistema de herramientas de código abierto. Los ingenieros suelen utilizar frameworks como PyTorch o TensorFlow para crear arquitecturas personalizadas. Estas librerías proporcionan las operaciones de tensores de bajo nivel necesarias para la convolución y la retropropagación.

For teams looking to streamline the lifecycle of computer vision projects—from data collection to deployment—the Ultralytics Platform offers a comprehensive solution. It simplifies complex workflows, allowing developers to focus on applying CNNs to solve business problems rather than managing infrastructure. Additionally, models can be exported to formats like ONNX or TensorRT for high-performance deployment on edge devices.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático