Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Action Recognition

Explora cómo el reconocimiento de acciones identifica comportamientos en video. Aprende a usar YOLO26 de Ultralytics para la estimación de poses y construye sistemas de IA inteligentes para tareas de HAR.

El reconocimiento de acciones, también conocido comúnmente como reconocimiento de actividades humanas (HAR, por sus siglas en inglés), es un subcampo dinámico de la visión artificial (CV) que se ocupa de identificar y clasificar comportamientos o movimientos específicos realizados por sujetos en datos de vídeo. Mientras que la detección de objetos tradicional responde a la pregunta "¿qué hay en la imagen?", el reconocimiento de acciones aborda la pregunta más compleja de "¿qué está sucediendo a lo largo del tiempo?". Al analizar secuencias de fotogramas en lugar de imágenes estáticas, los modelos de aprendizaje automático (ML) pueden distinguir entre actividades complejas como "caminar", "montar en bicicleta", "caerse" o "darse la mano", lo que lo convierte en un componente crucial para construir sistemas inteligentes que comprendan la intención y el contexto humanos.

Link to this sectionConceptos y técnicas fundamentales#

Reconocer acciones requiere que un modelo procese tanto información espacial (qué aspecto tienen los objetos o personas) como información temporal (cómo se mueven a través del tiempo). Para lograrlo, los sistemas modernos de inteligencia artificial (IA) emplean a menudo arquitecturas especializadas que van más allá de las redes neuronales convolucionales (CNN) estándar.

  • Estimación de poses: Una técnica potente en la que el modelo rastrea puntos clave específicos en el cuerpo humano, como codos, rodillas y hombros. Los cambios geométricos en estos puntos clave a lo largo del tiempo proporcionan una señal fuerte para clasificar acciones, independientemente del ruido de fondo.
  • Modelado temporal: Los algoritmos utilizan estructuras como redes neuronales recurrentes (RNN) o redes de memoria a corto y largo plazo (LSTM) para recordar fotogramas pasados y predecir acciones futuras. Más recientemente, los Video Transformers han ganado popularidad por su capacidad para manejar dependencias de largo alcance en flujos de vídeo.
  • Redes de dos corrientes: Este enfoque procesa características espaciales (fotogramas RGB) y características temporales (a menudo usando flujo óptico) en corrientes paralelas, fusionando los datos para realizar una clasificación final.

Link to this sectionAplicaciones en el mundo real#

La capacidad de interpretar automáticamente el movimiento humano tiene un potencial transformador en diversas industrias, mejorando la seguridad, la eficiencia y la experiencia del usuario.

  • IA en la asistencia sanitaria: El reconocimiento de acciones es vital para los sistemas de monitorización de pacientes. Por ejemplo, permite la detección automatizada de caídas en residencias de ancianos, alertando al personal inmediatamente si un paciente se desploma. También se utiliza en la rehabilitación física remota, donde entrenadores de IA analizan la forma de ejercicio de un paciente para garantizar que realice los movimientos de forma correcta y segura.
  • Vigilancia inteligente y seguridad: Más allá de la simple detección de movimiento, los sistemas de seguridad avanzados utilizan el reconocimiento de acciones para identificar comportamientos sospechosos, como peleas, robos en tiendas o entradas no autorizadas, mientras ignoran las actividades benignas. Esto reduce las falsas alarmas y mejora la monitorización de seguridad en tiempo real.

Link to this sectionImplementación del análisis de acciones con Ultralytics#

Un flujo de trabajo común implica detectar primero a las personas y su pose esquelética, y luego analizar el movimiento de esas articulaciones. El modelo Ultralytics YOLO26 ofrece velocidad y precisión de vanguardia para el paso inicial de estimación de poses, que es la base para muchas canalizaciones de reconocimiento de acciones.

El siguiente ejemplo demuestra cómo extraer puntos clave esqueléticos de un fotograma de vídeo usando Python:

from ultralytics import YOLO

# Load the YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")

# Run inference on an image to detect person keypoints
results = model("https://ultralytics.com/images/bus.jpg")

# Process results
for result in results:
    # Access the keypoints (x, y, visibility)
    if result.keypoints is not None:
        print(f"Detected keypoints shape: {result.keypoints.data.shape}")

Link to this sectionDistinción de términos relacionados#

Es importante diferenciar el reconocimiento de acciones de otras tareas similares de visión artificial para garantizar que se apliquen los métodos correctos.

  • Reconocimiento de acciones frente al seguimiento de objetos: El seguimiento de objetos se centra en mantener la identidad de un objeto o persona específica a medida que se mueve entre fotogramas (por ejemplo, "La persona A está en la coordenada X"). El reconocimiento de acciones interpreta el comportamiento de ese sujeto rastreado (por ejemplo, "La persona A está corriendo").
  • Reconocimiento de acciones frente a la comprensión de vídeo: Mientras que el reconocimiento de acciones identifica actos físicos específicos, la comprensión de vídeo es un concepto más amplio que implica comprender la narrativa completa, el contexto y las relaciones causales dentro de una escena de vídeo.

Link to this sectionDesafíos y tendencias futuras#

Desarrollar modelos robustos de reconocimiento de acciones presenta desafíos, particularmente con respecto a la necesidad de grandes conjuntos de datos de vídeo anotados como Kinetics-400 o UCF101. Etiquetar datos de vídeo requiere mucho más tiempo que etiquetar imágenes estáticas. Para abordar esto, herramientas como la Plataforma Ultralytics ayudan a optimizar el flujo de trabajo de anotación y entrenamiento.

Además, la eficiencia computacional es crítica. Procesar vídeo de alta resolución en tiempo real requiere importantes recursos de hardware. La industria se encamina cada vez más hacia la Edge AI, optimizando modelos para que se ejecuten directamente en cámaras y dispositivos móviles con el fin de reducir la latencia y el uso de ancho de banda. Los avances futuros aspiran a mejorar la generalización del modelo, permitiendo que los sistemas reconozcan acciones incluso desde puntos de vista para los que no fueron entrenados explícitamente.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático