Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Attention Mechanism

Explora cómo los mecanismos de atención revolucionan la IA al imitar el enfoque humano. Aprende cómo los componentes de consulta, clave y valor impulsan la precisión en YOLO26 de Ultralytics.

Un mecanismo de atención es una técnica fundamental en la inteligencia artificial (IA) que imita la capacidad cognitiva humana para centrarse en detalles específicos mientras ignora información irrelevante. En el contexto del aprendizaje profundo (DL), este mecanismo permite a una red neuronal (NN) asignar dinámicamente diferentes niveles de importancia, o "pesos", a diferentes partes de los datos de entrada. En lugar de procesar una imagen o frase completa con el mismo énfasis, el modelo aprende a prestar atención a las características más significativas, como una palabra específica en una oración para comprender el contexto, o un objeto distintivo en una escena visual compleja. Este avance es la fuerza impulsora detrás de la arquitectura Transformer, que ha revolucionado campos que van desde el procesamiento de lenguaje natural (NLP) hasta la visión artificial (CV) avanzada.

Link to this sectionCómo funciona la atención#

Diseñados originalmente para resolver las limitaciones de memoria en las redes neuronales recurrentes (RNNs), los mecanismos de atención abordan el problema del gradiente desvaneciente creando conexiones directas entre partes distantes de una secuencia de datos. El proceso suele describirse mediante una analogía de recuperación que involucra tres componentes: consultas (Queries), claves (Keys) y valores (Values).

  • Consulta (Query, Q): Representa lo que el modelo está buscando actualmente (p. ej., el sujeto de una oración).
  • Clave (Key, K): Actúa como un identificador para la información disponible en la entrada.
  • Valor (Value, V): Contiene el contenido de información real.

Al comparar la consulta con varias claves, el modelo calcula una puntuación de atención. Esta puntuación determina cuánto del valor se recupera y se utiliza para formar la salida. Esto permite a los modelos manejar dependencias de largo alcance de manera efectiva, entendiendo las relaciones entre los puntos de datos independientemente de su distancia entre sí.

Link to this sectionAplicaciones en el mundo real#

Los mecanismos de atención han permitido algunos de los avances más visibles en la tecnología moderna.

  • Traducción automática: Sistemas como el Traductor de Google dependen de la atención para alinear palabras entre idiomas. Al traducir "The black cat" (inglés) a "Le chat noir" (francés), el modelo debe invertir el orden adjetivo-sustantivo. La atención permite al decodificador centrarse en "black" al generar "noir" y en "cat" al generar "chat", garantizando la precisión gramatical.
  • Análisis de imágenes médicas: En el sector sanitario, los mapas de atención ayudan a los radiólogos destacando regiones sospechosas en radiografías o resonancias magnéticas. Por ejemplo, al diagnosticar anomalías en conjuntos de datos de tumores cerebrales, el modelo concentra su potencia de procesamiento en el tejido tumoral mientras filtra el tejido cerebral sano, mejorando la precisión del diagnóstico.
  • Vehículos autónomos: Los coches autónomos utilizan la atención visual para priorizar elementos críticos de la carretera. En medio de una calle concurrida, el sistema se centra intensamente en los peatones y los semáforos, tratándolos como señales de alta prioridad, mientras presta menos atención a los elementos estáticos del fondo como el cielo o los edificios.

Link to this sectionAtención frente a convolución#

Es importante distinguir la atención de las redes neuronales convolucionales (CNNs). Mientras que las CNNs procesan datos localmente utilizando una ventana fija (kernel) para detectar bordes y texturas, la atención procesa los datos globalmente, relacionando cada parte de la entrada con cualquier otra parte.

  • Autoatención (Self-Attention): Un tipo específico de atención donde el modelo se observa a sí mismo para entender el contexto dentro de una sola secuencia.
  • Eficiencia: Los modelos de atención pura pueden ser computacionalmente costosos (complejidad cuadrática). Las técnicas de optimización modernas como Flash Attention utilizan el hardware de GPU de manera más efectiva para acelerar el entrenamiento.

Aunque los modelos de última generación como Ultralytics YOLO26 están optimizados para la inferencia en tiempo real utilizando estructuras CNN avanzadas, las arquitecturas híbridas como RT-DETR (Real-Time Detection Transformer) utilizan explícitamente la atención para lograr una alta precisión. Ambos tipos de modelos se pueden entrenar y desplegar fácilmente utilizando la plataforma Ultralytics.

Link to this sectionEjemplo de código#

El siguiente ejemplo de Python demuestra cómo realizar una inferencia utilizando RT-DETR, una arquitectura de modelo que se basa fundamentalmente en mecanismos de atención para la detección de objetos.

from ultralytics import RTDETR

# Load a pre-trained RT-DETR model which uses attention mechanisms
# This model captures global context effectively compared to pure CNNs
model = RTDETR("rtdetr-l.pt")

# Perform inference on an image URL
results = model("https://ultralytics.com/images/bus.jpg")

# Print the number of detections found via transformer attention
print(f"Detected {len(results[0].boxes)} objects using attention-based detection.")

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático