Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Clasificación de imágenes

Descubra la clasificación de imágenes con Ultralytics YOLO: entrene modelos personalizados para sanidad, agricultura, comercio minorista y mucho más utilizando herramientas de vanguardia.

La clasificación de imágenes es una tarea fundamental en la visión por computadora (CV), en la que un modelo de aprendizaje automático analiza una imagen completa y le asigna una única etiqueta de un conjunto predefinido de categorías. Básicamente, responde a la pregunta: «¿Cuál es el tema principal de esta imagen?». Como componente central de la inteligencia artificial (IA), este proceso permite a los sistemas automatizados organizar, categorizar e interpretar datos visuales a gran escala. Aunque pueda parecer sencillo a simple vista, para que los ordenadores puedan reconocer patrones se necesitan sofisticados algoritmos de aprendizaje automático (ML) que acorten la distancia entre los píxeles sin procesar y los conceptos significativos.

El mecanismo detrás de la clasificación

La clasificación moderna de imágenes se basa en gran medida en arquitecturas de aprendizaje profundo (DL) conocidas como redes neuronales convolucionales (CNN). Estas redes están diseñadas para imitar la forma en que la corteza visual biológica procesa la información. A través de un proceso denominado extracción de características, el modelo aprende a identificar atributos de bajo nivel, como bordes y texturas, en las primeras capas, y finalmente los combina para reconocer formas y objetos complejos en capas más profundas.

Para crear un clasificador, los desarrolladores utilizan el aprendizaje supervisado, alimentando el modelo con grandes cantidades de datos de entrenamiento que contienen ejemplos etiquetados. Grandes conjuntos de datos públicos como ImageNet han sido fundamentales para mejorar la precisión de estos sistemas. Durante la fase de inferencia, el modelo genera una puntuación de probabilidad para cada categoría, a menudo utilizando una función softmax para determinar la clase más probable .

Clasificación frente a otras tareas visuales

Es importante distinguir la clasificación de imágenes de otras capacidades relacionadas con la visión artificial, ya que la elección de la técnica depende del problema específico:

  • Clasificación frente a detección de objetos: La clasificación asigna una etiqueta a toda la imagen. Por el contrario, la detección de objetos identifica la ubicación de múltiples objetos dentro de una escena dibujando un cuadro delimitador alrededor de cada uno de ellos.
  • Clasificación frente a segmentación de imágenes: Mientras que la clasificación analiza el contexto global, la segmentación proporciona precisión a nivel de píxeles. La segmentación semántica clasifica cada píxel individual, lo que permite una delimitación exacta entre los objetos y el fondo.

Aplicaciones en el mundo real

La clasificación de imágenes impulsa una amplia gama de aplicaciones de IA en el mundo real en diversos sectores:

Diagnóstico sanitario

En el campo de la medicina, los modelos de clasificación ayudan a los radiólogos mediante el análisis de exploraciones diagnósticas. Las herramientas de análisis de imágenes médicas pueden clasificar rápidamente las radiografías o resonancias magnéticas como «normales» o «anormales», o identificar afecciones específicas, como la detección de tumores, lo que permite una clasificación y un diagnóstico más rápidos de los pacientes.

Control de calidad en la fabricación

Factories utilize automated visual inspection to maintain product standards. Cameras on assembly lines capture images of components, and classification models instantly label them as "pass" or "fail" based on visible defects. This automated quality control ensures only non-defective items reach the packaging stage.

Agricultura inteligente

Los agricultores aprovechan la IA en la agricultura para supervisar la salud de los cultivos. Al clasificar las imágenes tomadas por drones o teléfonos inteligentes, los sistemas pueden identificar signos de enfermedades, deficiencias nutricionales o infestaciones de plagas, lo que permite intervenciones agrícolas de precisión específicas.

Implementación de la clasificación con YOLO26

El marco Ultralytics , famoso por la detección, ofrece un rendimiento de vanguardia para las tareas de clasificación de imágenes. Su arquitectura está optimizada para la velocidad y la precisión, lo que lo hace adecuado para aplicaciones en tiempo real.

A continuación se muestra un ejemplo conciso de cómo cargar un modelo preentrenado y classify imagen utilizando el ultralytics Paquete Python :

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Run inference on an image source
results = model("https://ultralytics.com/images/bus.jpg")

# Print the top predicted class name
print(f"Prediction: {results[0].names[results[0].probs.top1]}")

Para los equipos que buscan optimizar su flujo de trabajo, Ultralytics simplifica todo el proceso. Permite a los usuarios gestionar conjuntos de datos de clasificación, realizar formación basada en la nube e implementar modelos en diversos formatos, como ONNX o TensorRT sin necesidad de una amplia infraestructura de codificación.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora