Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

3D Object Detection

Explora la detección de objetos en 3D para dominar la conciencia espacial en IA. Aprende cómo YOLO26 de Ultralytics potencia la estimación de profundidad, orientación y cuadros delimitadores en 3D en el mundo real.

La detección de objetos 3D es una tarea sofisticada de visión artificial que permite a las máquinas identificar, localizar y determinar el tamaño de objetos dentro de un espacio tridimensional. A diferencia de la detección de objetos 2D tradicional, que dibuja una caja delimitadora plana alrededor de un elemento en una imagen, la detección de objetos 3D estima un cuboide (una caja 3D) que encapsula el objeto. Esto proporciona información crítica de profundidad, orientación (rumbo) y dimensiones espaciales precisas, permitiendo a los sistemas entender no solo qué es un objeto, sino exactamente dónde está en relación con el sensor en el mundo real. Esta capacidad es fundamental para tecnologías que necesitan interactuar físicamente con su entorno.

Link to this sectionCómo funciona la detección de objetos 3D#

Para percibir profundidad y volumen, los modelos de detección 3D suelen depender de entradas de datos más ricas de las que proporcionan las cámaras estándar. Aunque algunos métodos avanzados pueden inferir estructuras 3D a partir de imágenes monoculares (de una sola lente), la mayoría de los sistemas robustos utilizan datos de sensores LiDAR, radar o cámaras estéreo. Estos sensores generan nubes de puntos: colecciones masivas de puntos de datos que representan la superficie externa de los objetos.

El proceso implica varios pasos clave:

  • Adquisición de datos: Los sensores capturan la geometría de la escena. El LiDAR, por ejemplo, utiliza pulsos láser para medir distancias, creando un mapa 3D preciso.
  • Extracción de características: Los modelos de aprendizaje profundo, a menudo basados en redes neuronales convolucionales (CNN) o Transformers, procesan la nube de puntos o los datos de imagen fusionados para identificar patrones.
  • Predicción de caja delimitadora: El modelo genera una caja delimitadora 3D definida por sus coordenadas centrales (x, y, z), dimensiones (largo, ancho, alto) y ángulo de rotación (guiñada).
  • Clasificación: De forma similar a la clasificación de imágenes, el sistema asigna una etiqueta (por ejemplo, "peatón", "vehículo") al objeto detectado.

Link to this sectionDiferencia entre la detección 2D y 3D#

Es importante distinguir entre estos dos conceptos relacionados.

  • Detección de objetos 2D: Opera sobre imágenes planas (píxeles). Te indica que un objeto está en la "esquina superior izquierda" o "inferior derecha" de un fotograma, pero no puede juzgar eficazmente la distancia o el tamaño real sin marcadores de referencia. Es ideal para tareas como identificar defectos de fabricación o analizar transmisiones de vídeo donde la profundidad es menos crítica.
  • Detección de objetos 3D: Opera en un espacio volumétrico (vóxeles o puntos). Proporciona la distancia desde la cámara (profundidad), el tamaño físico del objeto y su orientación. Esto es esencial para evitar colisiones en entornos dinámicos.

Link to this sectionAplicaciones en el mundo real#

La transición de la percepción 2D a la 3D desbloquea casos de uso potentes en industrias donde la seguridad y la conciencia espacial son primordiales.

  • Conducción autónoma: Los coches autónomos dependen en gran medida de la detección 3D para navegar con seguridad. Al procesar datos de LiDAR y cámaras, el vehículo puede detectar otros coches, peatones y obstáculos, calculando su distancia y velocidad exactas. Esto permite al sistema de percepción predecir trayectorias y tomar decisiones de frenado o dirección en escenarios de inferencia en tiempo real. Empresas como Waymo utilizan estos pesados conjuntos de sensores para mapear entornos urbanos al instante.
  • Robótica y recogida de contenedores: En logística y almacenamiento, los robots necesitan recoger objetos de diversas formas y tamaños de contenedores. La detección 3D permite a un brazo robótico entender la orientación de un paquete, determinar el mejor punto de agarre y planificar una trayectoria sin colisiones para mover el artículo. Esto mejora la eficiencia en IA en logística al automatizar tareas manuales complejas.

Link to this sectionImplementación de la detección de objetos con Ultralytics#

Aunque la detección 3D completa a menudo requiere arquitecturas especializadas para nubes de puntos, los detectores 2D modernos como YOLO26 se utilizan cada vez más como un componente en flujos de trabajo pseudo-3D o para estimar la profundidad mediante el escalado de cajas delimitadoras. Para los desarrolladores que buscan entrenar modelos con sus propios conjuntos de datos, la Plataforma Ultralytics ofrece un entorno optimizado para la anotación y el entrenamiento.

Aquí tienes un ejemplo sencillo de cómo ejecutar una detección estándar utilizando la API de Python de Ultralytics, que suele ser el primer paso en un proceso de percepción más amplio:

import cv2
from ultralytics import YOLO

# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Perform inference on a local image
results = model("path/to/image.jpg")

# Visualize the results
for result in results:
    # Plot predictions on the image (returns a numpy array)
    im_array = result.plot()

    # Display using OpenCV
    cv2.imshow("Detections", im_array)
    cv2.waitKey(0)  # Press any key to close
    cv2.destroyAllWindows()

Link to this sectionDesafíos y tendencias futuras#

A pesar de su utilidad, la detección de objetos 3D se enfrenta a desafíos relacionados con el coste computacional y el gasto de los sensores. Procesar millones de puntos en una nube de puntos requiere una potencia de GPU significativa, lo que dificulta el despliegue en dispositivos de borde. Sin embargo, las innovaciones en cuantización de modelos y las arquitecturas neuronales eficientes están reduciendo esta carga.

Además, técnicas como la fusión de sensores están mejorando la precisión al combinar la rica información de color de las cámaras con los datos precisos de profundidad del LiDAR. A medida que estas tecnologías maduren, podemos esperar ver la percepción 3D integrada en dispositivos más accesibles, desde gafas de realidad aumentada hasta electrodomésticos inteligentes.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático