Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Guías

¿Qué es la segmentación de instancias? Una guía rápida

Únete a nosotros mientras analizamos en profundidad qué es la segmentación de instancias, cómo funciona, su uso en diversas aplicaciones de visión artificial y el impacto que puede tener.

ABAbirami Vina
6 min read
Segmentación de instancias de objetos en una imagen

Las aplicaciones de visión artificial son cada vez más comunes en nuestra vida diaria, desde cámaras de tráfico que supervisan el estado de las carreteras hasta sistemas de autopago en tiendas. Al permitir que las máquinas comprendan datos visuales de una manera similar a la humana, la IA de visión está generando un impacto en una gran variedad de sectores.

Muchas de estas aplicaciones dependen de la detección de objetos, una tarea de visión artificial que coloca cuadros delimitadores alrededor de objetos clave en las imágenes. Aunque este enfoque suele funcionar bien, algunas soluciones de análisis de imágenes necesitan una precisión aún mayor.

Por ejemplo, las imágenes médicas requieren algo más que detectar un tumor: es crucial delimitar su forma exacta. Del mismo modo, en robótica, las máquinas necesitan reconocer los contornos exactos de un objeto para agarrarlo correctamente. Para abordar estos desafíos, la segmentación de instancias ofrece una solución más precisa.

La segmentación de instancias es una tarea de visión artificial diseñada para dar soporte a casos de uso donde la detección de objetos no es suficiente; proporciona precisión a nivel de píxel. Los modelos de visión artificial como Ultralytics YOLO11 se pueden utilizar para aplicar la segmentación de instancias a imágenes y vídeos con facilidad.

Uso de YOLO11 para segmentación de instancias

Fig. 1 Ejemplo de uso de YOLO11 para la segmentación de instancias.

En esta guía, desglosaremos cómo funciona la segmentación de instancias, sus aplicaciones y cómo se puede entrenar de forma personalizada Ultralytics YOLO11 para tareas de segmentación específicas.

Link to this section¿Qué es la segmentación de instancias?#

Supongamos que hay una foto de grupo de personas que están muy juntas. La detección de objetos puede ayudarte a dibujar cuadros alrededor de cada persona, pero eso no te indica su forma exacta.

La segmentación de instancias, por otro lado, es similar a trazar cuidadosamente alrededor de cada persona para que puedas ver su contorno completo, incluso si se solapan. En lugar de simplemente marcar dónde está algo con un cuadro, identifica la forma exacta de cada objeto a nivel de píxel, lo que facilita la comprensión de imágenes complejas.

El resultado es una máscara detallada que rellena la forma de un objeto, señalando exactamente qué píxeles le pertenecen. Este nivel de precisión es útil en muchas aplicaciones del mundo real donde es importante comprender la forma y los límites exactos de los objetos.

Compatibilidad de YOLO11 con segmentación de instancias

Fig. 2. Demostración de la compatibilidad de YOLO11 con la segmentación de instancias.

Link to this sectionSegmentación de instancias frente a segmentación semántica#

Al explorar la segmentación de instancias, es posible que te encuentres con el concepto de segmentación semántica.

Ambas técnicas ayudan a los ordenadores a comprender las imágenes a nivel de píxel, pero sirven para propósitos diferentes. La segmentación semántica etiqueta cada píxel según su categoría, agrupando todos los objetos del mismo tipo. Por ejemplo, en una imagen con varios coches, la segmentación semántica marcaría todos ellos como "coche" sin distinguir entre vehículos individuales.

La segmentación de instancias, por el contrario, va un paso más allá al identificar cada objeto por separado. Asigna etiquetas únicas a instancias individuales y crea máscaras precisas alrededor de sus formas. Así, en la misma imagen, la segmentación de instancias no solo etiquetaría todo como "coche", sino que reconocería y perfilaría cada coche de forma individual.

La principal diferencia entre ambas es que la segmentación semántica agrupa los objetos por categoría, mientras que la segmentación de instancias distingue cada objeto como una entidad única con límites claros. La elección de qué tarea utilizar depende de la aplicación específica: si basta con saber qué hay en una imagen o si es importante diferenciar entre objetos individuales.

Segmentación de instancias frente a segmentación semántica

Fig. 3 Segmentación de instancias frente a segmentación semántica (derecha e izquierda, respectivamente).

Link to this sectionModelos populares de segmentación de instancias#

Hoy en día, existen varios modelos de segmentación de instancias disponibles para la comunidad de IA de visión. Algunos son más rápidos, otros son más precisos y otros son más fáciles de usar.

Estas opciones, aunque útiles, pueden llevar a la pregunta: ¿cuál es la adecuada para una tarea específica? Entre las opciones, los modelos Ultralytics YOLO son bastante populares porque se centran en la velocidad y la precisión.

Además, estos modelos han evolucionado significativamente a lo largo de los años. Por ejemplo, Ultralytics YOLOv5 simplificó la implementación mediante el uso de frameworks como PyTorch, haciendo que la IA de visión avanzada fuera accesible a un público más amplio sin necesidad de grandes conocimientos técnicos.

Sobre la base de ese éxito, Ultralytics YOLOv8 introdujo una compatibilidad mejorada para tareas de visión artificial como la segmentación de instancias, la estimación de poses y la clasificación de imágenes.

Ahora, YOLO11 lleva el rendimiento a un nuevo nivel. Logra una mayor precisión media (mAP) en el conjunto de datos COCO con un 22% menos de parámetros que YOLOv8m, lo que significa que puede reconocer objetos con mayor precisión mientras utiliza menos recursos.

Evaluación comparativa del rendimiento de YOLO11

Fig. 4 Evaluación comparativa de YOLO11.

En pocas palabras, YOLO11 ofrece una precisión de última generación sin comprometer la eficiencia, lo que lo convierte en un punto de inflexión en el campo.

Link to this sectionComprender cómo funciona la segmentación de instancias#

A continuación, exploremos cómo suele funcionar la segmentación de instancias. Los modelos de visión artificial más antiguos utilizan un enfoque de dos pasos.

Primero, detectan los objetos dibujando cuadros delimitadores a su alrededor. Luego, generan una máscara a nivel de píxel para perfilar la forma exacta de cada objeto. Un ejemplo bien conocido es Mask R-CNN, que se basa en modelos de detección de objetos añadiendo un paso de predicción de máscara. Aunque este método es eficaz, puede ser lento porque procesa la imagen en varias etapas, lo que hace que las aplicaciones en tiempo real sean más difíciles.

Mientras tanto, modelos como YOLO11 procesan las imágenes de una sola vez, prediciendo simultáneamente los cuadros delimitadores de los objetos y las máscaras de segmentación de instancias. Este enfoque simplificado lo hace mucho más rápido sin dejar de mantener una gran precisión. Como resultado, es particularmente útil para aplicaciones en tiempo real como la conducción autónoma, el análisis de vídeo y la robótica, donde tanto la velocidad como la precisión son cruciales.

Link to this sectionEntrenamiento personalizado de YOLO11 para la segmentación de instancias#

YOLO11 viene de serie como un modelo preentrenado. Ha sido entrenado en el conjunto de datos COCO-Seg, que cubre objetos cotidianos para la segmentación de instancias. Sin embargo, el paquete de Python de Ultralytics admite el entrenamiento personalizado, lo cual es esencial para aplicaciones especializadas donde se necesitan segmentar objetos únicos.

¿Por qué es importante el entrenamiento personalizado o el ajuste de un modelo? El entrenamiento personalizado aprovecha el aprendizaje por transferencia construyendo sobre el conocimiento ya incrustado en los modelos preentrenados. En lugar de empezar desde cero, adapta un modelo existente a nuevas tareas utilizando conjuntos de datos más pequeños y menos recursos informáticos, todo ello manteniendo una gran precisión.

Link to this sectionCómo entrenar de forma personalizada YOLO11#

Aquí tienes un vistazo más detallado a los pasos necesarios para ajustar YOLO11 para la segmentación de instancias:

  • Preparación de los datos: recopila y anota imágenes según tu aplicación específica. Ultralytics ofrece compatibilidad con múltiples conjuntos de datos de imágenes, pero también puedes entrenar utilizando tu propio conjunto de datos preparando las imágenes y anotaciones en el formato YOLO requerido.
  • Uso de un modelo preentrenado: en lugar de empezar desde cero, utiliza un modelo Ultralytics YOLO11 preentrenado.
  • Entrenamiento del modelo: ajusta los parámetros vitales del entrenamiento, como el tamaño del lote (imágenes procesadas por iteración), el tamaño de la imagen (resolución de entrada objetivo) y las épocas (ciclos totales de entrenamiento), y entrena el modelo.
  • Evaluación del rendimiento: una vez completado el entrenamiento del modelo, puedes probar la precisión del modelo utilizando métricas de rendimiento como el mAP. El paquete de Python de Ultralytics también proporciona funciones integradas para la evaluación de modelos.

Link to this sectionAplicaciones de segmentación de instancias habilitadas por YOLO11#

La segmentación de instancias se puede utilizar para resolver desafíos del mundo real ayudando a las máquinas a ver y comprender los objetos con mayor precisión. Desde mejorar la automatización hasta proteger el medio ambiente, desempeña un papel clave en muchos campos. Repasemos algunos ejemplos de dónde está generando un impacto.

Link to this sectionSeguridad y control de obras de construcción con YOLO11#

La segmentación de instancias puede ser una parte fundamental para garantizar la seguridad y la eficiencia en las obras de construcción. Por ejemplo, se puede utilizar para controlar maquinaria pesada.

YOLO11 se puede ajustar para segmentar e identificar con precisión diferentes tipos de equipos, como grúas, excavadoras y excavadoras de arrastre, y realizar un seguimiento de sus posiciones en tiempo real. Esto permite a los responsables de la obra asegurarse de que la maquinaria opere estrictamente dentro de las áreas designadas y no invada zonas donde haya trabajadores o existan peligros.

Además, integrar dichas soluciones con sistemas de alerta en tiempo real permite tomar medidas correctivas rápidamente. Más allá de esto, la información recopilada puede ayudar a optimizar el diseño y el flujo de trabajo de la obra, reduciendo aún más los riesgos y aumentando la productividad.

Monitorización de maquinaria pesada mediante YOLO11

Fig. 5 Control de maquinaria pesada mediante YOLO11.

Link to this sectionControl de animales con segmentación y YOLO11#

El control del comportamiento animal ayuda a los investigadores, agricultores y conservacionistas a cuidar mejor a los animales en diferentes entornos. La segmentación de instancias desempeña un papel útil en estos sistemas al identificar y segmentar animales individuales en granjas, zoológicos y hábitats naturales. A diferencia de la detección de objetos tradicional que utiliza cuadros delimitadores, la segmentación de instancias proporciona una delimitación a nivel de píxel de cada animal, lo que es particularmente útil cuando los animales están muy cerca unos de otros.

La segmentación detallada facilita un seguimiento más preciso de los movimientos y comportamientos. Los animales superpuestos o agrupados estrechamente pueden reconocerse de forma diferenciada y proporcionar un análisis más preciso de las interacciones, las evaluaciones de salud y los patrones de actividad. En general, una visión más profunda del comportamiento animal mejora el cuidado de los animales y las prácticas de gestión.

Monitorización de ganado mediante segmentación de instancias

Fig. 6 Control de ganado mediante segmentación de instancias.

Link to this sectionYOLO11 en el análisis deportivo y el seguimiento de jugadores#

El seguimiento preciso de jugadores y eventos es una parte enorme del análisis deportivo. Los métodos de seguimiento tradicionales se basan en el etiquetado manual, que puede no capturar interacciones detalladas. La visión artificial puede utilizarse para segmentar detalles como cada jugador, el balón y los eventos clave a nivel de píxel para obtener información detallada.

Por ejemplo, la segmentación de instancias puede ayudar a detectar eventos como faltas o incidentes sin balón al separar claramente a cada jugador y objeto. Este control granular habilitado por modelos como YOLO11 ofrece a los analistas información más clara para estudiar patrones de movimiento, posicionamiento espacial e interacciones con gran precisión. Una ventaja clave de esta información es que ayuda a los equipos a perfeccionar sus estrategias y mejorar el rendimiento general.

Link to this sectionVentajas y desventajas de la segmentación de instancias#

Aquí tienes algunos de los beneficios clave que la segmentación de instancias puede aportar a diversos sectores:

  • Automatización mejorada: Al automatizar tareas como el control de calidad y la supervisión de la seguridad, la segmentación de instancias reduce la necesidad de intervención manual y minimiza el error humano.
  • Mejor comprensión de la escena: Al perfilar con precisión cada objeto, la segmentación de instancias contribuye a una comprensión más profunda de las escenas complejas, apoyando una toma de decisiones más informada.
  • Postprocesamiento eficiente: La salida a nivel de píxel simplifica tareas como la eliminación de fondo, el recuento de objetos y el análisis espacial, lo que reduce la necesidad de pasos de procesamiento adicionales.

Aunque estos beneficios destacan cómo la segmentación de instancias impacta en diferentes casos de uso, también es fundamental considerar los desafíos que conlleva su implementación.

Aquí tienes algunas de las limitaciones clave de la segmentación de instancias:

  • Desafíos con la transparencia: Segmentar objetos transparentes o reflectantes como el cristal y el agua es difícil, lo que genera límites imprecisos.
  • Gastos generales de mantenimiento: Para mantener los modelos precisos y relevantes, es necesario realizar actualizaciones y ajustes continuos a medida que cambian las condiciones ambientales y los conjuntos de datos.
  • Alto esfuerzo de anotación: El entrenamiento de modelos de segmentación de instancias requiere anotaciones detalladas a nivel de píxel, lo que aumenta significativamente el tiempo y el coste que implica la preparación de los datos.

Link to this sectionConclusiones clave#

La segmentación de instancias hace posible distinguir objetos individuales con precisión, incluso cuando se superponen. Al capturar los límites de los objetos a nivel de píxel, proporciona una comprensión más profunda de los datos visuales en comparación con las tareas de visión artificial tradicionales, como la detección de objetos.

Los recientes avances en visión artificial han hecho que la segmentación de instancias sea más rápida y fácil de usar. En particular, modelos de visión artificial como Ultralytics YOLO11 simplifican el proceso, permitiendo una segmentación en tiempo real con una configuración mínima, lo que lo hace más accesible para diversos sectores y aplicaciones.

¿Tienes curiosidad por la IA? Visita nuestro repositorio de GitHub y conecta con nuestra comunidad para seguir explorando. Infórmate sobre innovaciones como la IA en coches autónomos y la IA de visión en la agricultura en nuestras páginas de soluciones. ¡Consulta nuestras opciones de licencia y empieza un proyecto de visión artificial!

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático