Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Clasificación de imágenes

Descubra la clasificación de imágenes con Ultralytics YOLO: entrene modelos personalizados para sanidad, agricultura, comercio minorista y mucho más utilizando herramientas de vanguardia.

La clasificación de imágenes es una tarea fundamental en visión por ordenador (CV) que consiste en asignar una a toda una imagen digital en función de su contenido visual. Este proceso permite a las máquinas "ver" e interpretar el mundo reconociendo patrones, objetos o escenas en los datos visuales. Como componente componente central de la inteligencia artificial (IA), sirve sistemas de reconocimiento visual más complejos, lo que permite a los sistemas automatizados categorizar grandes grandes cantidades de información visual.

Cómo funciona la clasificación de imágenes

A nivel técnico, la clasificación de imágenes se basa en algoritmos de aprendizaje automático, en particular modelos de aprendizaje profundo (DL) conocidos como redes neuronales convolucionales (CNN). Estas redes están diseñadas para procesar datos de píxeles y realizar automáticamente automáticamente la extracción de características de bajo nivel, como bordes y texturas en las primeras capas, y formas complejas en las capas más profundas.

El proceso suele seguir un aprendizaje supervisado:

  1. Entrenamiento: El modelo se alimenta de un conjunto de datos etiquetados, tales como ImageNetque contiene miles o millones de imágenes con categorías conocidas.
  2. Aprendizaje: A través de retropropagación, la red ajusta sus pesos internos para minimizar los errores de predicción.
  3. Inferencia: Una vez entrenado, el modelo puede analizar nuevas imágenes no vistas y emitir una puntuación de probabilidad para cada clase utilizando una función softmax. La categoría con la probabilidad más alta se asigna como etiqueta final.

Frameworks populares como PyTorch y TensorFlow proporcionan las herramientas necesarias para construir y arquitecturas sofisticadas.

Diferenciar la clasificación de las tareas relacionadas

Aunque la clasificación de imágenes responde a la pregunta "¿Qué hay en esta imagen?", a menudo se confunde con otras tareas de visión por ordenador. Entender las distinciones es crucial para seleccionar la herramienta adecuada para un proyecto:

  • Detección de objetos: A diferencia de la clasificación, que etiqueta toda la imagen, la detección de objetos identifica dónde se encuentran los objetos. objetos. Dibuja un cuadro delimitador alrededor de cada objeto y los clasifica individualmente.
  • Segmentación de imágenes: Ofrece precisión a nivel de píxel. La segmentación semántica clasifica cada cada píxel en una categoría (p. ej., carretera frente a cielo), mientras que la segmentación por instancias distingue entre objetos individuales de la misma clase.

Aplicaciones en el mundo real

La clasificación de imágenes es omnipresente en todos los sectores, ya que impulsa la automatización y mejora los procesos de toma de decisiones.

1. Imágenes médicas y asistencia sanitaria

En el campo del análisis de imágenes médicas, los modelos de clasificación ayudan a los radiólogos a preseleccionar las exploraciones. Por ejemplo, los algoritmos pueden classify las radiografías de tórax o las resonancias magnéticas como "normales" o "anormales". de tórax o resonancias magnéticas como "normales" o "anormales", señalando posibles problemas como neumonía o tumores para su prioridad. Una investigación de los Institutos Nacionales de Salud (NIH ) demuestra cómo la IA ayuda en el diagnóstico precoz de enfermedades, mejorando significativamente los resultados de los pacientes. Puede obtener más información sobre nuestro trabajo en detección de tumores con YOLO11.

2. Agricultura inteligente

La agricultura de precisión utiliza la clasificación de imágenes para controlar la salud de los cultivos. Los drones equipados con cámaras captan imágenes de los campos, que luego se analizan para classify las plantas como sanas, deficientes en nutrientes o enfermas. Esto permite Esto permite una intervención específica, reduciendo el uso de productos químicos y aumentando el rendimiento. El sitio Departamento de Agricultura de Estados Unidos (USDA) destaca cómo estas tecnologías promueven prácticas agrícolas sostenibles. Descubra cómo Ultralytics apoya la IA en la agricultura para revolucionar la moderna.

Clasificación con YOLO11

Aunque es famoso por su detección, el Ultralytics YOLO11 también es muy eficaz en tareas de tareas de clasificación de imágenes. Ofrece un equilibrio entre velocidad y precisión, lo que la hace adecuada para aplicaciones en tiempo real.

A continuación se muestra un ejemplo conciso de cómo utilizar un modelo YOLO11 preentrenado para classify una imagen utilizando la función ultralytics Paquete Python :

from ultralytics import YOLO

# Load a pre-trained YOLO11 classification model
model = YOLO("yolo11n-cls.pt")

# Run inference on an external image URL
results = model("https://ultralytics.com/images/bus.jpg")

# Print the top predicted class name
print(f"Predicted class: {results[0].names[results[0].probs.top1]}")

Los usuarios que deseen crear sus propias soluciones pueden entrenar modelos personalizados en conjuntos de datos específicos utilizando la misma sencilla API. Tanto si se implementa en dispositivos periféricos con herramientas como OpenCV o escalando con infraestructura en la nube, los modelos de clasificación modernos ofrecen la versatilidad necesaria para diversos escenarios.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora