Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Deformable Attention

Explora cómo la Atención Deformable optimiza el procesamiento de datos espaciales. Aprende cómo este mecanismo disperso mejora las tareas de visión por computadora y los modelos de Ultralytics YOLO26.

La atención deformable es un mecanismo de atención avanzado diseñado para optimizar cómo las redes neuronales procesan datos espaciales, particularmente en tareas de visión artificial (CV). Los módulos de atención tradicionales evalúan las interacciones entre todos los puntos posibles en una imagen, lo que resulta en una sobrecarga computacional masiva al trabajar con entradas de alta resolución. La atención deformable resuelve esto enfocándose solo en un conjunto pequeño y dinámico de puntos de muestreo clave alrededor de un píxel de referencia. Al permitir que la red aprenda exactamente dónde mirar en lugar de escanear estrictamente toda la cuadrícula, reduce drásticamente el uso de memoria y acelera el entrenamiento mientras mantiene capacidades robustas de deep learning.

Link to this sectionDiferenciación de modalidades de atención#

Comprender cómo encaja esta técnica en las arquitecturas modernas requiere diferenciarla de conceptos relacionados. Mientras que la atención estándar calcula un mapeo global y denso de todos los píxeles, la atención deformable se basa en mecanismos de atención dispersa para muestrear selectivamente regiones de interés. Además, difiere de Flash Attention. Flash Attention es una optimización a nivel de hardware que acelera la atención exacta estándar al minimizar las lecturas/escrituras en la memoria de la GPU. Por el contrario, la atención deformable cambia fundamentalmente la operación matemática al alterar a qué características visuales presta atención el modelo.

Estos conceptos se exploran activamente en la investigación de vanguardia de Google DeepMind y los desarrollos de visión de OpenAI, así como implementados de forma nativa dentro del ecosistema PyTorch y las arquitecturas de TensorFlow. Sin embargo, los modelos basados puramente en atención a veces pueden sufrir complejidades de despliegue. Para proyectos que requieren inferencia de alta velocidad sin la sobrecarga de capas complejas de Transformer, Ultralytics YOLO26 sigue siendo el estándar recomendado para la detección de objetos orientada al borde (edge).

Link to this sectionAplicaciones en el mundo real#

La naturaleza dispersa y eficiente de este concepto ha permitido avances significativos en industrias que requieren un análisis en tiempo real de imágenes densas.

  • Vehículos autónomos y sistemas de conducción: los coches autónomos dependen de cámaras de alta definición para navegar en entornos complejos. La atención deformable permite a los sistemas integrados aislar rápidamente características críticas, como peatones distantes o señales de tráfico parcialmente ocultas, sin desperdiciar potencia de cómputo analizando el cielo vacío. Las perspectivas sobre estos sistemas se publican con frecuencia en la investigación de visión artificial de IEEE y en la biblioteca digital de la ACM.
  • Análisis y diagnóstico de imágenes médicas: los patólogos utilizan imágenes de diagnóstico de alta resolución para detectar anomalías celulares. Al utilizar un muestreo espacial inteligente, los modelos de visión pueden identificar anomalías microscópicas en escaneos de gigapíxeles sin reducir la escala de la imagen y perder datos de diagnóstico críticos. Metodologías similares impulsadas por la atención a menudo se ven reflejadas en el enfoque de Anthropic sobre la IA respecto a la seguridad y la precisión.
  • Sistemas de vigilancia inteligente: las cámaras de seguridad modernas procesan flujos de vídeo de múltiples megapíxeles. Los mecanismos de atención ayudan a aislar rápidamente sujetos en movimiento o equipaje desatendido en escenas concurridas, reduciendo los falsos positivos mientras operan en dispositivos de borde (edge) con limitaciones.

Link to this sectionEjemplo de código#

Puedes experimentar sin problemas con modelos que utilizan estos mecanismos de atención, como RT-DETR (Real-Time DEtection TRansformer), utilizando el paquete ultralytics. El siguiente ejemplo demuestra cómo cargar un modelo y realizar una inferencia en una imagen de alta resolución.

from ultralytics import RTDETR

# Load a pre-trained RT-DETR model which utilizes specialized attention mechanisms
model = RTDETR("rtdetr-l.pt")

# Perform inference on an image to detect and locate objects
results = model("https://ultralytics.com/images/bus.jpg")

# Print the bounding box coordinates for the detected objects
for box in results[0].boxes:
    print(f"Object found at coordinates: {box.xyxy[0].tolist()}")

Para agilizar tus flujos de trabajo de machine learning, Ultralytics Platform ofrece herramientas intuitivas para el entrenamiento y despliegue basados en la nube. Simplifica todo el proceso, desde la anotación de datasets hasta la exportación de modelos altamente optimizados, asegurando que los desarrolladores puedan enfocarse en crear soluciones en lugar de gestionar infraestructuras complejas.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático