Descubra cómo los cuadros delimitadores definen la ubicación de los objetos en la visión artificial. Explore los formatos de coordenadas, las aplicaciones en el mundo real y cómo utilizar Ultralytics .
Un cuadro delimitador es una región rectangular definida por un conjunto de coordenadas que encierra un objeto específico dentro de una imagen o fotograma de vídeo. En el campo de la visión por ordenador (CV), estos cuadros sirven como anotaciones fundamentales para enseñar a los sistemas de inteligencia artificial (IA) a localizar y reconocer elementos distintos. En lugar de limitarse a clasificar una imagen completa como «que contiene un coche», un cuadro delimitador permite a un modelo señalar la ubicación exacta y la extensión espacial del coche, separándolo del fondo y de otras entidades. Esta capacidad de localización es esencial para las tareas de detección de objetos, cuyo objetivo es identificar múltiples objetos simultáneamente con alta precisión.
Para procesar datos visuales de manera eficaz, los modelos de aprendizaje automático (ML) se basan en sistemas de coordenadas específicos para representar matemáticamente los rectángulos delimitadores. El formato elegido suele determinar cómo se preparan los datos para el entrenamiento del modelo y cómo el modelo genera sus predicciones.
Los rectángulos delimitadores son los bloques de construcción de innumerables soluciones de IA en diversas industrias. Al permitir una localización precisa , permiten que los sistemas interactúen de manera inteligente con el mundo físico.
Cuando se utilizan arquitecturas modernas como YOLO26, el modelo
predice cuadros delimitadores junto con una etiqueta de clase y un
puntuación de confianza. El siguiente ejemplo muestra cómo
ejecutar la inferencia en una imagen y acceder a las coordenadas del cuadro delimitador utilizando el ultralytics paquete.
from ultralytics import YOLO
# Load the YOLO26 model
model = YOLO("yolo26n.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Access bounding box coordinates (xyxy format) for the first detected object
boxes = results[0].boxes
print(boxes.xyxy[0]) # Output: tensor([x1, y1, x2, y2, ...])
Aunque los rectángulos delimitadores son estándar para la detección general, son distintos de otros tipos de anotación utilizados en tareas más granulares.
La creación de anotaciones de cuadros delimitadores de alta calidad es un paso fundamental en el proceso de aprendizaje automático. Ultralytics simplifica este proceso al ofrecer herramientas para la anotación de datos y la gestión de conjuntos de datos. Una anotación adecuada garantiza que los modelos aprendan a distinguir objetos con precisión, minimizando errores como el sobreajuste o la confusión de fondo. Durante la inferencia se utilizan técnicas avanzadas como la supresión no máxima (NMS) para refinar estas predicciones eliminando los recuadros superpuestos, lo que garantiza que solo quede la detección más precisa para cada objeto.