¡Sintonice YOLO Vision 2025!
25 de septiembre de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024

¿Cómo usar Ultralytics YOLO11 para la clasificación de imágenes?

Abirami Vina

4 minutos de lectura

11 de noviembre de 2024

Descubra cómo el nuevo modelo Ultralytics YOLO11 mejora la clasificación de imágenes, ofreciendo una mejor precisión para tareas en agricultura, comercio minorista y monitorización de la vida silvestre.

Supongamos que un robot está mirando a dos gatos, uno negro y otro blanco, y necesita averiguar cuál es cuál. Para ello, puede utilizar la clasificación de imágenes, una tarea de visión artificial que ayuda a identificar y categorizar objetos o escenas en una imagen. De hecho, gracias a los recientes avances en inteligencia artificial (IA), la clasificación de imágenes se puede utilizar en una amplia variedad de aplicaciones que van desde la monitorización de animales hasta la fabricación y la agricultura con la detección de enfermedades de los cultivos.

Uno de los últimos avances en la clasificación de imágenes es el modelo Ultralytics YOLO11. Lanzado en el evento híbrido anual de Ultralytics, YOLO Vision 2024 (YV24), YOLO11 está diseñado para abordar una amplia variedad de tareas de IA de visión, incluyendo la clasificación de imágenes, con facilidad y precisión.

En este artículo, exploraremos los fundamentos de la clasificación de imágenes, analizaremos aplicaciones del mundo real y le mostraremos cómo puede utilizar YOLO11 para la clasificación de imágenes a través del paquete de Python de Ultralytics. También echaremos un vistazo a cómo puede probar las capacidades de YOLO11 en el HUB de Ultralytics en unos sencillos pasos. ¡Empecemos!

__wf_reserved_inherit
Fig. 1. Un ejemplo del uso de Ultralytics YOLO11 para clasificar un gato persa.

¿Qué es la clasificación de imágenes?

La clasificación de imágenes funciona asignando una etiqueta o tag a una imagen basándose en patrones aprendidos de imágenes etiquetadas previamente. Mediante el análisis cuidadoso de los píxeles de una imagen, un modelo de visión artificial puede encontrar la mejor coincidencia para la imagen. Los modelos fiables como YOLO11 pueden gestionar este proceso sin problemas. La arquitectura del modelo YOLO11 permite procesar imágenes o fotogramas de vídeo casi al instante, lo que lo hace ideal para aplicaciones que necesitan una clasificación de imágenes rápida y precisa.

Para comprender verdaderamente el alcance de la clasificación de imágenes, ayuda a distinguirla de otras tareas como la detección de objetos. Mientras que la clasificación de imágenes etiqueta una imagen completa, la detección de objetos identifica y localiza cada objeto dentro de la imagen. 

__wf_reserved_inherit
Fig 2. Una comparación de clasificación de imágenes, detección de objetos y segmentación de imágenes.

Consideremos una imagen de una jirafa. En la clasificación de imágenes, el modelo podría etiquetar toda la imagen simplemente como una jirafa basándose en su contenido general. Sin embargo, con la detección de objetos, el modelo no se detiene en la identificación de la jirafa; también coloca un cuadro delimitador alrededor de la jirafa, señalando su ubicación exacta dentro de la imagen.

Ahora, imagine una jirafa cerca de un árbol en una sabana con otros animales. Un modelo de clasificación de imágenes podría etiquetar toda la escena como una sabana o simplemente como vida salvaje. Sin embargo, con la detección de objetos, el modelo identificaría cada elemento individualmente, reconociendo la jirafa, el árbol y los demás animales, cada uno con sus propios cuadros delimitadores.

Aplicaciones de clasificación de imágenes con YOLO11

La precisión y el rendimiento del modelo Ultralytics YOLO11 para la clasificación de imágenes lo hacen útil en una amplia gama de industrias. Exploremos algunas de las aplicaciones clave de YOLO11 en la clasificación de imágenes.

Clasificación de imágenes con YOLO11 en la agricultura

La clasificación de imágenes puede ayudar a agilizar muchas funciones en la industria de la agricultura y la agricultura. Específicamente, utilizando modelos de clasificación de imágenes como YOLO11, los agricultores pueden monitorear constantemente la salud de sus cultivos, detectar enfermedades graves e identificar cualquier infestación de plagas con alta precisión. 

Aquí hay una mirada a cómo funciona esto:

  • Captura de imágenes: Los dispositivos de Internet de las cosas (IoT) como cámaras y drones pueden ser desplegados para capturar imágenes en tiempo real de los cultivos desde varios ángulos y ubicaciones en los campos.
  • Procesamiento: Dependiendo de los recursos disponibles y la conectividad, las imágenes pueden procesarse in situ mediante edge computing o cargarse en la nube para un análisis más intensivo.
  • Clasificación de imágenes con YOLO11: El modelo YOLO11 puede analizar estas imágenes para clasificar diversas condiciones de los cultivos. Las clases comunes podrían incluir sano, enfermo, infestado de plagas o deficiente en nutrientes, lo que ayuda a identificar problemas específicos que afectan a diferentes áreas del campo.
  • Generación de información: Basándose en las clasificaciones, YOLO11 proporciona información sobre los indicadores de salud de los cultivos, ayudando a los agricultores a detectar los primeros signos de enfermedad, identificar los puntos críticos de plagas o detectar deficiencias de nutrientes.
  • Toma de decisiones informada: Con estos conocimientos, los agricultores pueden tomar decisiones específicas sobre el riego, la fertilización y el control de plagas, aplicando los recursos solo donde más se necesitan.
__wf_reserved_inherit
Fig. 3. Un ejemplo de diferentes clases de hojas, desde sanas hasta infectadas.

Clasificación de imágenes con YOLO11 en el sector minorista

La clasificación de imágenes puede mejorar significativamente la experiencia de compra minorista, haciéndola más personalizada y fácil de usar. Los minoristas pueden utilizar modelos de visión artificial entrenados a medida para reconocer los productos de su inventario e integrar esta capacidad en sus aplicaciones móviles o sitios web. Los clientes pueden entonces buscar productos simplemente subiendo una foto, haciendo que la compra sea más rápida y cómoda.

Una vez que un cliente sube una imagen a un sistema de búsqueda visual, suceden varias cosas entre bastidores antes de que aparezcan los resultados de la búsqueda. 

En primer lugar, la detección de objetos puede utilizarse para identificar los elementos principales de la imagen, como identificar una prenda de vestir o un mueble y separarlo del fondo. A continuación, la clasificación de imágenes puede utilizarse para clasificar aún más cada elemento, reconociendo si se trata de una chaqueta, una camisa, un sofá o una mesa. 

Con esta información, el sistema puede mostrar productos similares disponibles para la compra, lo que es especialmente útil para encontrar artículos únicos o de moda que son difíciles de describir solo con palabras. La misma tecnología también puede ayudar a agilizar otras tareas minoristas, como la gestión de inventario, reconociendo y clasificando automáticamente los artículos.

__wf_reserved_inherit
Fig. 4. Una plataforma de búsqueda visual basada en la clasificación de imágenes en acción.

Monitoreo de la vida silvestre con clasificación de imágenes YOLO11

Tradicionalmente, el monitoreo de animales en la naturaleza es una tarea tediosa que involucra a muchas personas que clasifican y analizan manualmente miles de fotos. Con los modos de visión artificial como YOLO11, los investigadores pueden monitorear automáticamente a los animales a un ritmo más rápido. Se pueden colocar cámaras en hábitats naturales para tomar fotos. El modelo de IA de visión se puede utilizar para analizar estas fotos y clasificar los animales dentro de ellas (si los hay). Dicho sistema puede ayudar a los investigadores a estudiar y rastrear las poblaciones de animales, sus patrones de migración, etc.

Otra forma en que la IA y los modelos de visión artificial como YOLO11 pueden ayudar en este campo es agilizando el proceso de clasificación de especies en peligro de extinción. Al identificar las posibles especies o categorías de razas a las que puede pertenecer un animal, estos modelos pueden proporcionar datos esenciales para los investigadores. Por ejemplo, la Universidad de Tasmania (UTAS) desarrolló un sistema basado en la clasificación de imágenes para monitorear la diferente fauna de Tasmania. Las predicciones de los modelos pueden ayudar a los científicos e investigadores a vigilar la actividad y el comportamiento de los animales, lo que puede indicar amenazas como la caza furtiva o la pérdida de hábitat

__wf_reserved_inherit
Fig. 5. YOLO11 prediciendo las posibles razas a las que podría pertenecer un perro.

Probando la clasificación de imágenes con el modelo YOLO11

Ahora que hemos analizado qué es la clasificación de imágenes y hemos explorado algunas de sus aplicaciones, veamos cómo puedes probar la clasificación de imágenes con el nuevo modelo YOLO11. Hay dos maneras fáciles de empezar: usando el paquete de Python de Ultralytics o a través de Ultralytics HUB. Repasaremos ambas opciones.

Ejecución de inferencias usando YOLO11

Para empezar a usar el paquete de Python de Ultralytics, simplemente instálelo usando pip, conda o Docker. Si tiene algún problema, consulte nuestra Guía de problemas comunes para obtener consejos útiles para la resolución de problemas.

Una vez instalado el paquete, puede utilizar el siguiente código para cargar una variante del modelo de clasificación de imágenes YOLO11 y ejecutar una inferencia en una imagen. Ejecutar una inferencia significa utilizar un modelo entrenado para hacer predicciones sobre datos nuevos y no vistos. ¡Puede probarlo con una imagen de su elección!

__wf_reserved_inherit
Fig 6. Ejecución de inferencias utilizando el modelo YOLO11.

Entrenamiento de un modelo de clasificación YOLO11 personalizado

También puede utilizar el mismo paquete de Python para entrenar un modelo de clasificación YOLO11 personalizado. El entrenamiento personalizado le permite ajustar un modelo YOLO11 para sus necesidades específicas. Por ejemplo, si está desarrollando una aplicación para clasificar diferentes razas de gatos, puede entrenar un modelo YOLO11 personalizado solo para ese propósito.

El siguiente código muestra cómo cargar y entrenar un modelo de clasificación de imágenes YOLO11. Le permite transferir pesos pre-entrenados, utilizando el conocimiento de un modelo existente para impulsar el rendimiento de su propio modelo. Puede especificar un conjunto de datos, como el conjunto de datos "fashion-mnist", que es un conjunto bien conocido de imágenes en escala de grises de artículos de ropa (camisas, pantalones, zapatos, etc.). El entrenamiento del modelo en este conjunto de datos le enseña a reconocer diferentes categorías de ropa. Puede cambiar "fashion-mnist" por cualquier conjunto de datos que se ajuste a su proyecto, como razas de gatos o tipos de plantas.

__wf_reserved_inherit
Fig 7. Entrenamiento personalizado de un modelo YOLO11 para la clasificación de imágenes.

Prueba YOLO11 en Ultralytics HUB

Aunque el uso del paquete Ultralytics es sencillo, requiere cierto conocimiento de Python. Si está buscando una opción más amigable para principiantes, puede utilizar Ultralytics HUB, una plataforma diseñada para hacer que el entrenamiento y la implementación de diferentes modelos YOLO sean simples y accesibles. Para empezar, tendrá que crear una cuenta.

Una vez que haya iniciado sesión, vaya a la sección ‘Models’ y seleccione el modelo YOLO11 para la clasificación de imágenes. Verá una gama de tamaños de modelo disponibles: nano, pequeño, mediano, grande y extra grande. Después de elegir un modelo, puede cargar una imagen en la sección ‘Preview’, donde las predicciones aparecerán en el lado izquierdo de la página una vez que se procese la imagen.

__wf_reserved_inherit
Fig 8. Uso de Ultralytics HUB para ejecutar una inferencia.

Conclusiones clave

YOLO11 ofrece potentes capacidades de clasificación de imágenes que abren nuevas posibilidades en diversas industrias. Desde la mejora de la monitorización de cultivos en la agricultura y la mejora de las búsquedas de productos en el comercio minorista hasta el apoyo a la conservación de la vida silvestre, la velocidad y la precisión de YOLO11 lo hacen ideal para diversas aplicaciones. Con opciones para el entrenamiento personalizado a través del paquete de Python de Ultralytics o una configuración sencilla y sin código en Ultralytics HUB, los usuarios pueden incorporar fácilmente YOLO11 en sus flujos de trabajo. A medida que más industrias adoptan soluciones de IA, YOLO11 ofrece una herramienta flexible y de alto rendimiento que apoya la innovación y los avances prácticos.

Para explorar más, visite nuestro repositorio de GitHub e interactúe con nuestra comunidad. Explore las aplicaciones de IA en coches autónomos y atención médica en nuestras páginas de soluciones. 🚀

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Comienza gratis
Enlace copiado al portapapeles