Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Self-Attention

Explora los fundamentos de la autoatención en el aprendizaje profundo. Aprende cómo los vectores de consulta, clave y valor potencian los Transformers y Ultralytics YOLO26 para una IA superior.

La autoatención es un mecanismo fundamental en el deep learning que permite a los modelos ponderar la importancia de diferentes elementos dentro de una secuencia de entrada en relación con los demás. A diferencia de las arquitecturas tradicionales que procesan los datos de forma secuencial o se centran solo en los vecindarios locales, la autoatención permite a una red neuronal examinar todo el contexto simultáneamente. Esta capacidad ayuda a los sistemas a identificar relaciones complejas entre partes distantes de los datos, como palabras en una frase o regiones distintas en una imagen. Sirve como el bloque de construcción central de la arquitectura Transformer, que ha impulsado avances masivos en la IA generativa y los sistemas de percepción modernos.

Link to this sectionCómo funciona la autoatención#

El mecanismo imita el enfoque cognitivo al asignar un peso, a menudo llamado "puntuación de atención", a cada característica de entrada. Para calcular estas puntuaciones, el modelo transforma los datos de entrada, representados normalmente como embeddings, en tres vectores distintos: la Consulta (Query), la Clave (Key) y el Valor (Value).

  • Consulta (Query) (Q): Representa el elemento actual que busca contexto relevante del resto de la secuencia.
  • Clave (Key) (K): Actúa como una etiqueta o identificador para cada elemento de la secuencia contra el que se compara la consulta.
  • Valor (Value) (V): Contiene el contenido informativo real del elemento que se agregará.

El modelo compara la Consulta de un elemento con las Claves de todos los demás elementos para determinar la compatibilidad. Estas puntuaciones de compatibilidad se normalizan mediante una función softmax para crear pesos similares a probabilidades. Estos pesos se aplican entonces a los Valores, generando una representación rica en contexto. Este proceso permite a los Grandes Modelos de Lenguaje (LLM) y a los sistemas de visión priorizar la información significativa mientras filtran el ruido.

Link to this sectionAplicaciones en el mundo real#

La versatilidad de la autoatención ha llevado a su adopción generalizada en diversos dominios de la Inteligencia Artificial (IA).

  • Procesamiento del Lenguaje Natural (PLN): En tareas como la traducción automática, la autoatención resuelve la ambigüedad vinculando pronombres con sus referentes. Por ejemplo, en la frase "El animal no cruzó la calle porque estaba demasiado cansado", el modelo usa la autoatención para asociar fuertemente "estaba" con "animal" en lugar de con "calle". Esta conciencia contextual impulsa herramientas como Google Translate.
  • Contexto global de la imagen: En Visión Artificial (CV), arquitecturas como el Vision Transformer (ViT) dividen las imágenes en parches y aplican la autoatención para entender la escena globalmente. Esto es vital para la detección de objetos en entornos complejos donde identificar un objeto depende de comprender su entorno.

Link to this sectionDistinción de términos relacionados#

Aunque a menudo se discuten junto a conceptos similares, estos términos tienen definiciones técnicas distintas:

  • Mecanismo de atención: La amplia categoría de técnicas que permiten a los modelos centrarse en partes específicas de los datos. Engloba la atención cruzada (Cross-Attention), donde un modelo utiliza una secuencia (como una salida de decodificador) para consultar una secuencia diferente (como una entrada de codificador).
  • Autoatención: Un tipo específico de atención donde la Consulta, la Clave y el Valor se originan todos de la misma secuencia de entrada. Está diseñado para aprender dependencias internas dentro de un único conjunto de datos.
  • Flash Attention: Un algoritmo de optimización desarrollado por investigadores de la Universidad de Stanford que hace que el cálculo de la autoatención sea significativamente más rápido y eficiente en cuanto a memoria en GPUs sin alterar el resultado matemático.

Link to this sectionEjemplo de código#

El siguiente fragmento de Python demuestra cómo usar RTDETR, un detector de objetos basado en Transformer incluido en el paquete ultralytics. A diferencia de las redes convolucionales estándar, este modelo depende en gran medida de la autoatención para procesar características visuales.

from ultralytics import RTDETR

# Load the RT-DETR model which utilizes self-attention for detection
model = RTDETR("rtdetr-l.pt")

# Perform inference on an image to detect objects with global context
# Self-attention helps the model understand relationships between distant objects
results = model("https://ultralytics.com/images/bus.jpg")

# Print the number of objects detected
print(f"Detected {len(results[0].boxes)} objects using Transformer attention.")

Link to this sectionEvolución e impacto futuro#

La autoatención resolvió eficazmente el problema del gradiente desvaneciente que obstaculizaba a las anteriores Redes Neuronales Recurrentes (RNN), permitiendo el entrenamiento de modelos fundacionales masivos. Aunque es altamente eficaz, el coste computacional de la autoatención estándar crece de forma cuadrática con la longitud de la secuencia. Para solucionar esto, la investigación actual se centra en mecanismos de atención lineales eficientes.

Ultralytics integra estos avances en modelos de última generación como YOLO26, que combina la velocidad de las CNN con la potencia contextual de la atención para una inferencia en tiempo real superior. Estos modelos optimizados pueden entrenarse y desplegarse fácilmente a través de la Plataforma Ultralytics, agilizando el flujo de trabajo para los desarrolladores que construyen la próxima generación de aplicaciones inteligentes.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático