Cuadro delimitador
Descubra cómo los recuadros delimitadores permiten la detección de objetos, la IA y los sistemas de aprendizaje automático. Explore su papel en las aplicaciones de visión por ordenador.
Un cuadro delimitador es una anotación rectangular utilizada en visión por ordenador para indicar la ubicación de un objeto dentro de una imagen o un fotograma de vídeo. Es un componente fundamental de la detección de objetos, ya que proporciona una forma sencilla pero eficaz de definir la posición y la escala de un objeto. En el aprendizaje automático, los modelos se entrenan en grandes conjuntos de datos de imágenes con cuadros delimitadores etiquetados para aprender a identificar y localizar objetos por sí mismos. Los resultados de estos modelos incluyen las coordenadas de la caja, una etiqueta de clase (por ejemplo, "coche", "persona") y una puntuación de confianza que indica la certeza del modelo en su predicción.
Cómo funcionan las cajas delimitadoras
Un cuadro delimitador suele definirse mediante un conjunto de coordenadas que especifican su posición y tamaño. Las representaciones más comunes son:
- Coordenadas superior izquierda con anchura y altura (x, y, w, h): Este formato especifica las coordenadas x e y de la esquina superior izquierda, junto con la anchura y la altura de la caja.
- Puntos de esquina (x_min, y_min, x_max, y_max): Este formato define las coordenadas de las esquinas superior izquierda e inferior derecha del rectángulo.
Estas coordenadas se utilizan para entrenar modelos de aprendizaje profundo, que aprenden a predecir estos valores para imágenes nuevas no vistas. La precisión de un cuadro delimitador predicho se evalúa a menudo utilizando una métrica llamada Intersección sobre Unión (IoU), que mide el solapamiento entre el cuadro predicho y el cuadro real. Los modelos modernos de detección de objetos, como Ultralytics YOLO11, están altamente optimizados para generar recuadros delimitadores precisos en tiempo real.
Tipos de cuadros delimitadores
Existen dos tipos principales de cuadros delimitadores:
- Cuadro delimitador alineado con el eje: Es el tipo más común, en el que los lados del rectángulo están alineados con los ejes horizontal y vertical de la imagen. Son fáciles de representar y procesar, pero pueden resultar ineficaces con objetos girados o de forma irregular, ya que el rectángulo puede incluir una zona de fondo considerable.
- Caja delimitadora orientada (OBB): Este tipo de caja incluye un parámetro adicional para la rotación, lo que le permite ajustarse mejor a los objetos inclinados. Los OBB son especialmente útiles en aplicaciones especializadas, como el análisis de imágenes por satélite o las imágenes aéreas de drones, en las que los objetos suelen verse desde varios ángulos. Modelos como YOLO11 admiten la detección orientada de objetos para manejar estos escenarios con mayor eficacia.
Relación con otros conceptos
Los recuadros delimitadores están estrechamente relacionados con otras tareas de visión por ordenador, pero tienen una finalidad distinta.
- Detección de objetos frente a segmentación de imágenes: Mientras que la detección de objetos utiliza cuadros delimitadores para localizarlos, la segmentación de imágenes ofrece una comprensión más detallada de la forma de un objeto. La segmentación de instancias, por ejemplo, va un paso más allá al trazar el límite exacto a nivel de píxel de cada objeto distinto, en lugar de limitarse a dibujar un rectángulo a su alrededor. Esto resulta útil para aplicaciones que requieren información precisa sobre la forma. Encontrará más información en esta guía sobre la segmentación de instancias.
- Caja delimitadora frente a caja de anclaje: En algunos modelos de detección de objetos, conocidos como detectores basados en anclajes, se utilizan cajas predefinidas denominadas "cajas de anclaje" como referencias para ayudar al modelo a predecir el cuadro delimitador final. Por el contrario, los detectores sin anclajes predicen los recuadros delimitadores directamente sin estos preajustes, lo que a menudo simplifica la arquitectura del modelo.
Aplicaciones en el mundo real
Las cajas delimitadoras forman parte integral de numerosas aplicaciones prácticas de la IA:
- Vehículos autónomos: Los coches autónomos dependen en gran medida de la detección de objetos para identificar y localizar peatones, otros vehículos y semáforos utilizando cuadros delimitadores. Esta conciencia espacial, a menudo lograda mediante modelos de aprendizaje profundo, es fundamental para una navegación segura. Empresas como Waymo exhiben ampliamente esta tecnología. Ultralytics ofrece información sobre la IA en los coches autoconducidos.
- Análisis del comercio minorista: En el comercio minorista, las cajas delimitadoras ayudan en la gestión de inventarios impulsada por IA mediante la detección de productos en los estantes, la supervisión de los niveles de existencias y el análisis del comportamiento de los clientes a través de patrones de tráfico peatonal(recuento de objetos).
- Seguridad y vigilancia: Las cajas delimitadoras permiten a los sistemas de vigilancia automatizados detectar y seguir a personas u objetos en tiempo real, activando alertas de actividades sospechosas. Esto es fundamental para aplicaciones de construcción como los sistemas de alarma de seguridad.
- Análisis de imágenes médicas: En el ámbito sanitario, los recuadros delimitadores ayudan a los médicos a resaltar posibles anomalías, como tumores, en las exploraciones, lo que contribuye a acelerar el diagnóstico. Puede ver ejemplos en Radiología: Inteligencia Artificial y en nuestra página de análisis de imágenes médicas.
- Agricultura: Las cajas delimitadoras se utilizan en la agricultura de precisión para tareas como la identificación de frutas para la cosecha, el control de la salud de los cultivos o la detección de plagas, como se detalla en nuestro blog sobre visión por ordenador en la agricultura.