Object Detection
Explora los fundamentos de la detección de objetos. Aprende cómo Ultralytics YOLO26 identifica y localiza objetos en tiempo real con una velocidad y precisión inigualables.
La detección de objetos es una tecnología fundamental en el campo de la Visión Artificial (CV) que permite a los sistemas informáticos identificar y localizar elementos específicos dentro de datos visuales. A diferencia de las tareas más simples de clasificación de imágenes, que asignan una única etiqueta a una imagen completa, la detección de objetos proporciona una comprensión granular al predecir simultáneamente la clase de un objeto (p. ej., "persona", "coche", "perro") y su ubicación espacial. Esta ubicación se representa habitualmente mediante un cuadro delimitador rectangular que abarca el objeto, acompañado de una puntuación de confianza que indica la certeza del modelo. Esta doble capacidad (reconocimiento más localización) sirve como base sensorial para las aplicaciones modernas de Inteligencia Artificial (IA), permitiendo a las máquinas interactuar de forma significativa con su entorno.
Link to this sectionLa mecánica de la detección#
Los detectores modernos dependen en gran medida de arquitecturas de Deep Learning (DL), específicamente Redes Neuronales Convolucionales (CNNs), para extraer características complejas de las imágenes de entrada. El proceso comienza con una fase de entrenamiento, donde un modelo aprende a reconocer patrones utilizando colecciones masivas y etiquetadas como el dataset COCO. Durante esta fase, el algoritmo optimiza los pesos del modelo para minimizar los errores de predicción.
Cuando el modelo se despliega para inferencia, analiza nuevas imágenes para proponer objetos potenciales. Los algoritmos avanzados aplican entonces la Supresión de no máximos (NMS) para filtrar detecciones duplicadas, garantizando que cada entidad distinta se resalte solo una vez. La precisión de estas predicciones se evalúa a menudo utilizando la métrica Intersección sobre Unión (IoU), que mide la superposición entre el cuadro predicho y el valor real. Avances recientes han dado lugar a arquitecturas de extremo a extremo como YOLO26, que optimizan este pipeline para una velocidad excepcional y capacidades de inferencia en tiempo real en dispositivos periféricos.
Link to this sectionDiferenciación de términos clave#
Es crucial distinguir la detección de objetos de conceptos relacionados para elegir la herramienta adecuada para un proyecto:
- Detección de objetos frente a clasificación de imágenes: Mientras que la clasificación de imágenes responde a "¿Qué hay en esta imagen?", la detección de objetos responde a "¿Qué hay y dónde está?".
- Detección de objetos frente a segmentación de instancias: La detección dibuja un cuadro alrededor de un elemento. Por el contrario, la segmentación de instancias identifica el contorno (máscara) exacto, píxel a píxel, de cada objeto.
- Detección de objetos frente a seguimiento de objetos: La detección encuentra objetos en un solo fotograma. El seguimiento de objetos conecta estas detecciones a lo largo de una secuencia de vídeo para monitorizar el movimiento en el tiempo.
Link to this sectionAplicaciones en el mundo real#
La versatilidad de la detección de objetos impulsa la innovación en sectores importantes. En el sector automotriz, la IA en vehículos autónomos depende fundamentalmente de modelos de detección para identificar peatones, señales de tráfico y otros vehículos al instante para navegar con seguridad. Al procesar los feeds de vídeo de las cámaras integradas, estos sistemas toman decisiones en fracciones de segundo que previenen accidentes.
Otro caso de uso destacado se encuentra en la IA en el comercio minorista. Los sistemas de pago automatizados y los robots de gestión inteligente de inventario utilizan la detección de objetos para escanear estanterías, reconocer productos y detectar escasez de existencias o artículos fuera de lugar. Esta automatización optimiza las cadenas de suministro y mejora la experiencia del cliente al garantizar que los productos estén siempre disponibles.
Link to this sectionImplementación de la detección de objetos#
Los desarrolladores pueden implementar fácilmente workflows de detección utilizando el paquete de Python ultralytics. El siguiente ejemplo demuestra cómo cargar un modelo preentrenado YOLO26 y realizar inferencia sobre una imagen.
from ultralytics import YOLO
# Load the latest YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Run inference on an image from a URL
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results with bounding boxes
results[0].show()Para los equipos que buscan escalar sus operaciones, la Plataforma Ultralytics ofrece un entorno integral para anotar datos, entrenar modelos personalizados en la nube y desplegarlos en varios formatos como ONNX o TensorRT. Utilizar este tipo de plataformas simplifica el ciclo de vida de MLOps, permitiendo a los ingenieros centrarse en refinar sus aplicaciones en lugar de gestionar la infraestructura.






