Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Segmentación de imágenes

Descubra el poder de la segmentación de imágenes con Ultralytics YOLO. Explore la precisión a nivel de píxel, los tipos, las aplicaciones y los casos de uso de IA en el mundo real.

La segmentación de imágenes es una técnica visión por ordenador (VC) que consiste en dividir una imagen digital en múltiples subgrupos de píxeles, comúnmente denominados segmentos de imagen. El objetivo principal es simplificar la representación de una imagen en algo más significativo y fácil de analizar. A diferencia de detección de objetos, que los localiza en un rectangular, la segmentación de imágenes proporciona un mapa preciso, a nivel de píxel, de la forma de un objeto. Este proceso asigna una etiqueta a cada píxel de una imagen, lo que permite modelos de inteligencia artificial (IA) comprender los límites y contornos exactos de las entidades de una escena.

La importancia de la precisión a nivel de píxel

En muchos flujos de trabajo modernos de aprendizaje automático (ML), conocer la ubicación aproximada de un objeto es insuficiente. Las aplicaciones que requieren una interacción con el mundo físico, como un robot que agarra un paquete o un coche que circula por una carretera sinuosa, exigen un conocimiento detallado de la geometría. de la geometría. La segmentación de imágenes salva esta distancia convirtiendo los datos visuales brutos en un conjunto de regiones clasificadas. Esta capacidad de capacidad se basa en arquitecturas arquitecturas de aprendizaje profundo (AD), en particular Redes neuronales convolucionales (CNN), que extraen características espaciales para diferenciar entre los objetos en primer plano y el fondo.

Tipos de segmentación de imágenes

Comprender la tarea específica de segmentación es crucial para seleccionar la arquitectura de modelo adecuada. Las tres categorías principales son:

  • Segmentación semántica: Este método trata múltiples objetos de la misma categoría como una única entidad. Por ejemplo, en una escena callejera, todos píxeles pertenecientes a "carretera" son de color gris, y todos los píxeles pertenecientes a "coche" son de color azul. No distingue entre dos coches diferentes; simplemente identifica que ambos son vehículos. Este enfoque a menudo se implementa utilizando arquitecturas como la U-Net, desarrollada originalmente para la segmentación de imágenes biomédicas.
  • Segmentación de instancias: Esta técnica va un paso más allá al identificar objetos individuales distintos. Si hay cinco coches en una imagen, la segmentación por instancias generará cinco máscaras distintas, lo que permitirá al sistema contar y track cada vehículo de forma independiente. Esta es la principal tarea que realiza Ultralytics YOLO11 modelos de segmentación, que equilibran velocidad y precisión para aplicaciones en tiempo real.
  • Segmentación panóptica: A enfoque híbrido que combina la segmentación semántica y la segmentación por instancias. Proporciona una comprensión exhaustiva de la escena de la escena asignando una etiqueta de clase a cada píxel (cosas del fondo como el cielo y la carretera) e identificando (cosas como personas y coches).

Aplicaciones en el mundo real

La capacidad de delimitar fronteras precisas hace que la segmentación sea indispensable en diversos sectores:

  • Análisis de imágenes médicas: La segmentación es fundamental en la atención sanitaria para analizar exploraciones como IRM o TC TAC. Al delinear con precisión tumores, órganos o lesiones, los modelos de IA ayudan a los radiólogos en el diagnóstico y la planificación quirúrgica. planificación quirúrgica. Por ejemplo, identificar el volumen exacto de un tumor cerebral permite una radioterapia más selectiva, minimizando el daño al tejido sano.
  • Vehículos autónomos: Los coches autónomos dependen en gran medida de la segmentación para navegar con seguridad. Los modelos procesan los vídeos para identificar carriles, aceras, peatones y obstáculos. Organizaciones como la SAE International definen niveles de autonomía que requieren esta percepción detallada del entorno para tomar decisiones en fracciones de segundo.
  • Agricultura de precisión: En AI en la agricultura, la segmentación ayuda a controlar la salud de los cultivos. Los drones equipados con cámaras multiespectrales pueden segment los campos para identificar infestaciones de malas hierbas o deficiencias de nutrientes hoja por hoja, lo que permite la aplicación selectiva de herbicidas. o deficiencias de nutrientes hoja por hoja, lo que permite la aplicación selectiva de herbicidas.

Aplicación técnica de YOLO

Los marcos modernos han simplificado la ejecución de las tareas de segmentación. Mientras que los antiguos detectores de dos etapas, como R-CNN de máscara eran precisos pero lentos, los modelos de una sola etapa han revolucionado este campo al ofrecer inferencia en tiempo real. El sitio Ultralytics YOLO11 por ejemplo, admite la segmentación de instancias de forma nativa. De cara al futuro, YOLO26 se está desarrollando para optimizar aún más estas capacidades con procesamiento de extremo a extremo.

Los desarrolladores pueden utilizar bibliotecas estándar como OpenCV para el preprocesamiento y visualización, mientras que con PyTorch para el trabajo pesado de inferencia del modelo.

He aquí un ejemplo conciso de cómo realizar la segmentación de instancias utilizando un modelo YOLO11 preentrenado en Python:

from ultralytics import YOLO

# Load a pre-trained YOLO11 segmentation model
model = YOLO("yolo11n-seg.pt")

# Run inference on an image (can be a local path or URL)
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting image with segmentation masks overlaid
results[0].show()

Este fragmento de código se encarga automáticamente de las complejas tareas de extracción de características, regresión de cuadros delimitadores y generación de máscaras. permitiendo a los desarrolladores centrarse en integrar los resultados de la segmentación en aplicaciones más grandes.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora