Yolo Vision Shenzhen
Shenzhen
Únete ahora

Guía para la anotación de polígonos con Ultralytics

Descubre las anotaciones poligonales, cómo permiten una segmentación precisa de los objetos y cómo crear anotaciones fácilmente con Ultralytics .

¿Quieres poner en marcha un proyecto de visión artificial?

Descubre las opciones de licencia

Las tecnologías de IA de vanguardia se están abriendo paso en una amplia variedad de sectores, desde la conducción autónoma hasta la agricultura de precisión. Por ejemplo, los ganaderos lecheros están utilizando la IA y el análisis de imágenes para detect en el ganado. Se pueden controlar problemas de salud como la cojera observando cambios en la marcha y la postura del animal, como una espalda arqueada o movimientos asimétricos. 

Fig. 1. Ejemplo de monitorización de vacas mediante inteligencia artificial y análisis de imágenes.

La visión artificial, una rama de la inteligencia artificial, hace posibles estas aplicaciones al permitir que las máquinas interpreten y analicen datos visuales. En concreto, la segmentación de instancias es una tarea de visión artificial que identifica y segmenta cada objeto de una imagen a nivel de píxel, lo que permite detect analizar con precisión animales individuales.

La anotación de polígonos desempeña un papel fundamental en este proceso. Se trata de un método de anotación de datos que se utiliza para trazar con precisión la forma exacta de un objeto en una imagen mediante la colocación de puntos a lo largo de sus bordes. A diferencia de las simples anotaciones con cuadros delimitadores, este enfoque sigue el contorno real del objeto, lo que contribuye a crear datos de entrenamiento más precisos y permite a los modelos de IA de visión comprender mejor los límites de los objetos.

Hoy en día, existen muchas herramientas disponibles para crear anotaciones poligonales. Sin embargo, estas opciones suelen parecer fragmentadas, sobre todo cuando ofrecen una compatibilidad inconsistente o limitada con los distintos tipos de anotaciones, lo que dificulta la gestión de las diversas necesidades de etiquetado dentro de un mismo flujo de trabajo.

Ultralytics , nuestro nuevo entorno de trabajo integral de IA visual que une la gestión de conjuntos de datos, la anotación, el entrenamiento, la implementación y la supervisión, resuelve este problema al admitir múltiples tipos de anotación y flujos de trabajo asistidos por IA en un único entorno de trabajo integrado, lo que simplifica todo el proceso de anotación.

En este artículo, veremos qué son las anotaciones poligonales y cómo crearlas con Ultralytics . ¡Empecemos! 

Un análisis detallado de las anotaciones de polígonos

Antes de profundizar en Ultralytics y sus funciones de anotación de polígonos, demos un paso atrás para entender en qué consiste la anotación de polígonos. 

La anotación de imágenes es el proceso de añadir etiquetas a los datos visuales para que los modelos de IA puedan comprender lo que ven. Por lo general, consiste en identificar objetos en una imagen y marcarlos de manera que el modelo pueda aprender de ellos. 

Uno de los métodos más habituales consiste en dibujar rectángulos alrededor de los objetos, lo que se conoce como «cuadros delimitadores». Sin embargo, los cuadros delimitadores solo ofrecen un contorno aproximado del objeto. La anotación poligonal es un método más preciso.

Funciona trazando el contorno de un objeto (sus bordes) punto por punto, en lugar de encerrarlo en un rectángulo. Para ello, los anotadores colocan varios vértices (puntos) a lo largo de los bordes del objeto, trazando su contorno hasta cubrir toda la forma.

Estos puntos conectados forman un polígono que refleja el contorno natural del objeto. Dado que la forma sigue de cerca el contorno del objeto, la anotación capta detalles que los métodos de etiquetado tradicionales suelen pasar por alto. Esto resulta especialmente útil cuando los objetos tienen formas irregulares o bordes complejos, como las hojas, las siluetas humanas y los objetos superpuestos. 

Esta precisión en los datos ayuda a los modelos de aprendizaje automático a aprender de forma más eficaz durante su entrenamiento. Cuando las anotaciones captan con exactitud los límites reales de un objeto, los modelos pueden comprender mejor los patrones del objeto a nivel de píxel. Esto se traduce en un mejor rendimiento de los modelos, especialmente en tareas de segmentación que requieren una alta precisión.

El papel de las anotaciones de polígonos en los flujos de trabajo de visión artificial

Entonces, ¿cómo se utilizan realmente las anotaciones de polígonos? Están estrechamente relacionadas con los modelos de IA de visión que permiten realizar tareas de segmentación de imágenes, como la segmentación de instancias.

En muchas aplicaciones de visión artificial, es fundamental conocer el área exacta que ocupa cada objeto en una imagen o fotograma de vídeo. Un buen ejemplo es la detección de piezas de automóvil en el sector manufacturero. En este caso, los modelos deben identificar y delinear con precisión piezas como puertas, ventanas y faros, incluso cuando se superponen o tienen formas complejas.

Aquí es donde entra en juego la segmentación de instancias. Permite a los modelos detect objeto y trazar sus límites exactos a nivel de píxel. Esto difiere de la detección básica de objetos, que utiliza cuadros delimitadores. 

Fig. 2. La segmentación de instancias también puede ayudar a identificar las partes dañadas de un coche. (Fuente)

Los recuadros delimitadores solo proporcionan regiones rectangulares aproximadas alrededor de los objetos y, a menudo, incluyen fondo adicional, lo que dificulta la captura de formas irregulares o la separación de elementos superpuestos.

Las anotaciones de polígonos desempeñan un papel fundamental a la hora de lograr este nivel de precisión. Al trazar la forma exacta de cada objeto en las imágenes del conjunto de datos, se obtienen datos de entrenamiento de alta calidad que reflejan los límites reales de los objetos. Estas anotaciones detalladas ayudan a los modelos, como Ultralytics , a comprender mejor la estructura de cada componente, lo que se traduce en resultados de segmentación más precisos.

Limitaciones de las herramientas tradicionales de anotación de imágenes

A continuación, repasaremos las limitaciones de las herramientas de anotación tradicionales para comprender la necesidad de soluciones más eficientes y escalables, como Ultralytics .

Estos son algunos de los retos habituales a los que se enfrentan los anotadores al utilizar herramientas tradicionales de anotación de polígonos:

  • Compatibilidad limitada con los tipos de anotación: algunas herramientas se centran en una única técnica de anotación, lo que dificulta trabajar con diferentes tipos, como polígonos, cuadros delimitadores y puntos clave, en un mismo lugar.
  • Manejo ineficaz de anotaciones complejas: es posible que las herramientas carezcan de funciones que faciliten la anotación precisa de objetos complejos con detalles minuciosos.
  • Falta de funciones asistidas por IA: muchas herramientas dependen por completo del trabajo manual, sin contar con soporte de IA integrado que permita agilizar el proceso de anotación.
  • Gestión fragmentada de conjuntos de datos: gestionar conjuntos de datos, versiones y anotaciones puede resultar complicado, sobre todo cuando las herramientas no ofrecen un espacio de trabajo centralizado.

Ultralytics da respuesta a estas inquietudes con funciones de anotación asistidas por IA que se basan tanto en YOLO «Segment Anything Models» (SAM) como en YOLO . SAM los usuarios generar máscaras de segmentación de alta calidad a partir de entradas sencillas, como clics, que luego pueden perfeccionarse para convertirlas en anotaciones poligonales precisas. 

Del mismo modo, la anotación inteligente YOLO utiliza YOLO preentrenados o entrenados a medida para realizar inferencias sobre una imagen y añadir predicciones —como cuadros delimitadores, máscaras de segmentación o cuadros delimitadores orientados— en forma de anotaciones, que luego pueden revisarse y ajustarse según sea necesario. En conjunto, estas capacidades hacen que el proceso de anotación sea más rápido, más coherente y más fácil de escalar.

Diferentes tipos de anotaciones compatibles con Ultralytics

Ultralytics incluye un editor de anotaciones integrado que permite a los usuarios anotar imágenes directamente en el espacio de trabajo. Esto facilita la creación y la gestión de conjuntos de datos sin tener que recurrir a herramientas de etiquetado de datos independientes, que a menudo requieren mucho tiempo.

Además de las anotaciones poligonales, Ultralytics admite otros tipos de anotaciones. A continuación, te ofrecemos una breve descripción general:

  • Cuadros delimitadores: los anotadores pueden dibujar sencillos cuadros rectangulares alrededor de los objetos, lo que facilita detect etiquetado y detect en una imagen.
  • Puntos clave: Este método se utiliza para marcar puntos específicos, como las articulaciones del cuerpo o puntos de referencia, con fines tales como la estimación de la postura.
  • Cajas delimitadoras orientadas (OBB): permiten a los usuarios capturar objetos girados o inclinados con mayor precisión que las cajas delimitadoras estándar.
  • Etiquetas de clasificación: para tareas más sencillas, los usuarios pueden asignar etiquetas a imágenes completas en lugar de marcar objetos individuales.

Anotación de objetos con polígonos en Ultralytics

Ahora, veamos cómo crear anotaciones poligonales en la Ultralytics , ya sea de forma manual o con herramientas asistidas por IA.

Creación manual de anotaciones poligonales en Ultralytics

A continuación te ofrecemos una guía rápida paso a paso para crear anotaciones poligonales manualmente:

  • Paso 1: Accede a tu conjunto de datos: Abre el conjunto de datos que contiene las imágenes que deseas anotar. Aquí es donde se almacenan y gestionan tus imágenes y anotaciones.
  • Paso 2: Abre una imagen: haz clic en una imagen para abrirla en la interfaz de anotación. El proceso de anotación depende de la tarea del conjunto de datos. Por ejemplo, en un conjunto de datos de segmentación de instancias, las anotaciones se crean mediante máscaras poligonales.
  • Paso 3: Empieza a crear una máscara: haz clic en la imagen para comenzar a añadir anotaciones. Cada clic añade un vértice a lo largo del contorno del objeto.
  • Paso 4: Traza el contorno del objeto: sigue haciendo clic alrededor de los bordes del objeto para definir su forma.
  • Paso 5: completar el polígono: puedes pulsar «Intro» o hacer clic en el primer punto para completar el polígono y asignarle una etiqueta de clase.
  • Paso 6: Añadir anotaciones adicionales: Repite el proceso para crear más polígonos para otros objetos de la imagen.
  • Paso 7: Guardar anotaciones: Las anotaciones se guardan automáticamente a medida que las creas.
Fig. 3. Ejemplo de la creación manual de anotaciones poligonales mediante Ultralytics (Fuente)

Anotación inteligente de polígonos en Ultralytics

A continuación, veamos las funciones de etiquetado asistido por IA que ofrece Ultralytics y que agilizan el proceso de anotación.

La plataforma ofrece dos métodos de anotación inteligente: uno basado en los modelos «Segment Anything» para la generación interactiva de anotaciones mediante clics, y otro basado en YOLO para añadir directamente las predicciones del modelo como anotaciones. Ambos métodos pueden utilizarse para la anotación inteligente de polígonos. 

Anotación inteligente mediante SAM Ultralytics

La anotación SAM en Ultralytics simplifica el etiquetado manual mediante el uso del modelo «Segment Anything Model» (SAM) para generar máscaras de segmentación con un mínimo de datos de entrada. En lugar de trazar los objetos punto por punto, los usuarios pueden interactuar con la imagen mediante sencillas indicaciones, como clics, para indicar qué debe incluirse o excluirse.

La plataforma es compatible con varios SAM , incluidos SAM . SAM y SAM , lo que permite a los usuarios elegir entre un rendimiento más rápido o una mayor precisión, en función de sus necesidades. A partir de los datos introducidos por el usuario, SAM máscaras a nivel de píxel en tiempo real. Posteriormente, estas máscaras pueden perfeccionarse y utilizarse como anotaciones poligonales, lo que hace que el proceso sea más rápido, más coherente y más fácil de ampliar.

Estos son los pasos para utilizar SAM la anotación de polígonos en Ultralytics :

  • Paso 1: Abre una imagen: ve a tu conjunto de datos y haz clic en una imagen para abrir el visor a pantalla completa.
  • Paso 2: Accede al modo de anotación: haz clic en «Editar» y, a continuación, cambia al modo inteligente (o pulsa S) para activar SAM.
  • Paso 3: Selecciona un SAM : elige un SAM de la barra de herramientas en función de tus necesidades de velocidad y precisión.
  • Paso 4: Introducir indicaciones: haz clic con el botón izquierdo para añadir puntos positivos (incluir áreas) y con el botón derecho para añadir puntos negativos (excluir áreas).
  • Paso 5: Generar y aplicar la máscara: SAM una máscara de segmentación en tiempo real. Pulsa «Intro» (o utiliza la opción de aplicación automática) para aplicar la anotación.
  • Paso 6: Perfecciona la anotación: añade más puntos o ajusta el resultado si es necesario para mejorar la precisión antes de guardar. 
Fig. 4. Anotación de polígonos SAM en Ultralytics (Fuente)

Anotación inteligente mediante YOLO Ultralytics

La anotación inteligente YOLO de la Ultralytics agiliza el etiquetado mediante el uso deYOLO Ultralytics preentrenados o YOLO ajustados para generar predicciones sobre una imagen y añadirlas como anotaciones. Estas predicciones pueden incluir cuadros delimitadores, máscaras de segmentación o cuadros delimitadores orientados, dependiendo de la tarea del conjunto de datos. 

A continuación, los usuarios pueden revisar y perfeccionar estas anotaciones según sea necesario. A continuación se ofrece una descripción general de los pasos que hay que seguir para utilizar la anotación inteligente YOLO en Ultralytics :

  • Paso 1: Abre una imagen: ve a tu conjunto de datos y selecciona una imagen para abrirla en el visor a pantalla completa.
  • Paso 2: Accede al modo de anotación: haz clic en «Editar» y, a continuación, cambia al modo Inteligente (o pulsa S).
  • Paso 3: Selecciona un YOLO : elige un YOLO en el selector de modelos de la barra de herramientas.
  • Paso 4: Ejecutar la predicción: haz clic en «Predecir» para que el modelo genere las anotaciones automáticamente.
  • Paso 5: Revisar las anotaciones: Comprueba los recuadros delimitadores, las máscaras de segmentación o los OBB añadidos a la imagen.
  • Paso 6: Perfeccionar y guardar: Edita , ajusta o elimina las anotaciones incorrectas según sea necesario y, a continuación, guarda las etiquetas definitivas.
Fig. 5. Una visión general del uso de la anotación YOLO (Fuente)

Casos prácticos de anotación de polígonos

La anotación de polígonos está teniendo un gran impacto en todos los sectores, desde el control de calidad en la industria manufacturera hasta la agricultura y la sanidad. Veamos algunas aplicaciones clave en el mundo real. 

Detección de plagas mediante visión artificial

En la agricultura, el seguimiento del estado de los cultivos es fundamental para mejorar el rendimiento y reducir las pérdidas. Detectar las zonas afectadas por plagas en las hojas de los cultivos puede resultar complicado, ya que estas zonas suelen tener formas irregulares y límites poco definidos.

Este tipo de problema puede abordarse utilizando técnicas de segmentación de imágenes, como la segmentación semántica, que etiqueta todos los píxeles pertenecientes a una clase (por ejemplo, las zonas infectadas), o la segmentación de instancias, que separa los contornos de los objetos con mayor precisión.

Con Ultralytics , los usuarios pueden utilizar anotaciones poligonales para trazar la forma exacta de estas zonas infectadas. Esto contribuye a crear conjuntos de datos más precisos y facilita que los algoritmos de IA de visión detecten patrones sutiles en entornos agrícolas.

De este modo, los equipos pueden crear mejores datos de entrenamiento que ayuden a los modelos a identificar con exactitud dónde se producen las infestaciones de plagas. Esto resulta más eficaz que el uso de cuadros delimitadores, que pueden incluir partes de la hoja que no están afectadas.

Análisis de imágenes médicas basado en la segmentación por instancias

Al igual que ocurre con la detección de plagas en la agricultura, incluso las diferencias más pequeñas en los contornos pueden influir en el análisis de enfermedades como el cáncer en las pruebas de imagen médica. Esto resulta especialmente importante a la hora de identificar anomalías médicas, como tumores, en las tomografías computarizadas.

Los métodos de anotación tradicionales pueden pasar por alto bordes finos o incluir tejido circundante, lo que puede reducir la precisión. Con Ultralytics , los equipos pueden utilizar la anotación poligonal para trazar con precisión estas regiones en los datos de entrenamiento, lo que ayuda a los modelos a generar una segmentación tumoral más precisa y fiable.

Conclusiones clave

El etiquetado de polígonos es fundamental cuando los modelos deben interpretar las formas de los objetos en las imágenes con gran precisión. Ayuda a representar formas complejas con mayor exactitud, especialmente al utilizar Ultralytics . Al combinar la precisión con potentes herramientas, los equipos pueden crear modelos de IA más fiables y de mayor rendimiento.

¿Estás listo para incorporar la IA de visión a tus proyectos? Únete a nuestra comunidad y descubre la IA en la industria automovilística y la IA de visión en la robótica. Explora nuestro repositorio de GitHub para obtener más información. ¡Echa un vistazo a nuestras opciones de licencia y empieza hoy mismo! 

¡Construyamos juntos el futuro de la IA!

Comience su viaje con el futuro del aprendizaje automático