Cómo usar Ultralytics YOLO11 para la clasificación de imágenes
Aprende cómo el nuevo modelo Ultralytics YOLO11 mejora la clasificación de imágenes, ofreciendo una mayor precisión para tareas en agricultura, comercio minorista y vigilancia de la fauna.

Supongamos que un robot está mirando a dos gatos, uno negro y otro blanco, y necesita averiguar cuál es cuál. Para ello, puede usar la clasificación de imágenes, una tarea de visión artificial que ayuda a identificar y categorizar objetos o escenas en una imagen. De hecho, gracias a los avances recientes en inteligencia artificial (IA), la clasificación de imágenes se puede usar en una amplia variedad de aplicaciones que van desde el monitoreo de animales hasta la fabricación y la agricultura con la detección de enfermedades en cultivos.
Uno de los últimos avances en clasificación de imágenes es el modelo Ultralytics YOLO11. Lanzado en el evento híbrido anual de Ultralytics, YOLO Vision 2024 (YV24), YOLO11 está diseñado para abordar una gran variedad de tareas de visión por IA, incluida la clasificación de imágenes, con facilidad y precisión.
En este artículo exploraremos los fundamentos de la clasificación de imágenes, hablaremos de aplicaciones en el mundo real y te mostraremos cómo puedes usar YOLO11 para la clasificación de imágenes mediante el paquete de Python de Ultralytics. También veremos cómo puedes probar las capacidades de YOLO11 en Ultralytics HUB en unos pocos pasos sencillos. ¡Empecemos!

Fig 1. Un ejemplo del uso de Ultralytics YOLO11 para clasificar un gato persa.
Link to this section¿Qué es la clasificación de imágenes?#
La clasificación de imágenes funciona asignando una etiqueta o un marcador a una imagen en función de los patrones aprendidos a partir de imágenes etiquetadas previamente. Al analizar cuidadosamente los píxeles de una imagen, un modelo de visión artificial puede encontrar la mejor coincidencia para la imagen. Modelos fiables como YOLO11 pueden manejar este proceso sin problemas. La arquitectura del modelo de YOLO11 hace posible procesar imágenes o fotogramas de vídeo casi al instante, lo que lo hace ideal para aplicaciones que necesitan una clasificación de imágenes rápida y precisa.
Para comprender realmente el alcance de la clasificación de imágenes, ayuda distinguirla de otras tareas como la detección de objetos. Mientras que la clasificación de imágenes etiqueta toda una imagen, la detección de objetos identifica y localiza cada objeto dentro de ella.

Fig 2. Una comparación entre la clasificación de imágenes, la detección de objetos y la segmentación de imágenes.
Consideremos la imagen de una jirafa. En la clasificación de imágenes, el modelo podría etiquetar la imagen completa simplemente como "jirafa" basándose en su contenido general. Sin embargo, con la detección de objetos, el modelo no se detiene en identificar la jirafa; también coloca una caja delimitadora alrededor de la jirafa, señalando su ubicación exacta dentro de la imagen.
Ahora, imagina a la jirafa de pie cerca de un árbol en una sabana con otros animales. Un modelo de clasificación de imágenes podría etiquetar toda la escena como "sabana" o simplemente "vida silvestre". Sin embargo, con la detección de objetos, el modelo identificaría cada elemento individualmente, reconociendo a la jirafa, el árbol y los otros animales, cada uno con sus propias cajas delimitadoras.
Link to this sectionAplicaciones de clasificación de imágenes de YOLO11#
La precisión y el rendimiento del modelo Ultralytics YOLO11 para la clasificación de imágenes lo hacen útil en una amplia gama de sectores. Exploremos algunas de las aplicaciones clave de YOLO11 en la clasificación de imágenes.
Link to this sectionClasificación de imágenes con YOLO11 en la agricultura#
La clasificación de imágenes puede ayudar a agilizar muchas funciones en el sector de la agricultura y la ganadería. Concretamente, usando modelos de clasificación de imágenes como YOLO11, los agricultores pueden monitorear constantemente la salud de sus cultivos, detectar enfermedades graves e identificar cualquier plaga con gran precisión.
Aquí tienes un vistazo a cómo funciona:
- Captura de imágenes: Dispositivos de Internet de las cosas (IoT), como cámaras y drones, pueden ser desplegados para capturar imágenes en tiempo real de los cultivos desde varios ángulos y ubicaciones a través de los campos.
- Procesamiento: Dependiendo de los recursos disponibles y la conectividad, las imágenes pueden procesarse en el sitio a través de edge computing o subirse a la nube para un análisis más intensivo.
- Clasificación de imágenes con YOLO11: El modelo YOLO11 puede analizar estas imágenes para clasificar diversas condiciones de los cultivos. Las clases comunes pueden incluir: sano, enfermo, infestado de plagas o con deficiencia de nutrientes, lo que ayuda a identificar problemas específicos que afectan a diferentes áreas del campo.
- Generación de perspectivas: Basándose en las clasificaciones, YOLO11 proporciona información sobre los indicadores de salud de los cultivos, ayudando a los agricultores a detectar signos tempranos de enfermedades, identificar focos de plagas o detectar deficiencias de nutrientes.
- Toma de decisiones informada: Con esta información, los agricultores pueden tomar decisiones específicas sobre riego, fertilización y control de plagas, aplicando los recursos solo donde más se necesitan.

Fig 3. Un ejemplo de diferentes clases de hojas, desde sanas hasta infectadas.
Link to this sectionClasificación de imágenes con YOLO11 en el comercio minorista#
La clasificación de imágenes puede mejorar significativamente la experiencia de compra minorista, haciéndola más personalizada y fácil de usar. Los minoristas pueden usar modelos de visión artificial entrenados a medida para reconocer productos de su inventario e integrar esta capacidad en sus aplicaciones móviles o sitios web. Los clientes pueden buscar productos simplemente subiendo una foto, lo que hace que comprar sea más rápido y cómodo.
Una vez que un cliente sube una imagen a un sistema de búsqueda visual, ocurren varias cosas entre bastidores antes de que se muestren los resultados de búsqueda.
En primer lugar, se puede usar la detección de objetos para extraer los artículos principales de la imagen, como identificar una prenda de vestir o un mueble y separarlo del fondo. A continuación, se puede utilizar la clasificación de imágenes para categorizar aún más cada artículo, reconociendo si es una chaqueta, una camisa, un sofá o una mesa.
Con esta información, el sistema puede mostrar productos similares disponibles para su compra, lo cual es especialmente útil para encontrar artículos únicos o de moda que son difíciles de describir solo con palabras. La misma tecnología también puede ayudar a agilizar otras tareas minoristas, como la gestión de inventario, reconociendo y categorizando artículos automáticamente.

Fig 4. Una plataforma de búsqueda visual basada en clasificación de imágenes en acción.
Link to this sectionMonitoreo de vida silvestre con la clasificación de imágenes de YOLO11#
Tradicionalmente, monitorear animales en la naturaleza es una tarea tediosa que implica a muchas personas clasificando y analizando manualmente miles de fotos. Con modelos de visión artificial como YOLO11, los investigadores pueden monitorear animales automáticamente a un ritmo más rápido. Se pueden colocar cámaras en hábitats naturales para tomar fotos. El modelo de visión por IA se puede usar para analizar estas fotos y clasificar a los animales que aparecen en ellas (si los hay). Este sistema puede ayudar a los investigadores a estudiar y rastrear las poblaciones animales, sus patrones de migración, etc.
Otra forma en que los modelos de IA y visión artificial como YOLO11 pueden ayudar en este campo es simplificando el proceso de clasificación de especies en peligro de extinción. Al identificar posibles especies o categorías de razas a las que puede pertenecer un animal, estos modelos pueden proporcionar datos esenciales a los investigadores. Por ejemplo, la Universidad de Tasmania (UTAS) desarrolló un sistema basado en la clasificación de imágenes para monitorear diferentes especies de vida silvestre de Tasmania. Las predicciones de los modelos pueden ayudar a los científicos e investigadores a estar atentos a la actividad y el comportamiento de los animales, lo que podría indicar amenazas como la caza furtiva o la pérdida de hábitat.

Fig 5. YOLO11 prediciendo las posibles razas a las que podría pertenecer un perro.
Link to this sectionCómo probar la clasificación de imágenes con el modelo YOLO11#
Ahora que hemos hablado de qué es la clasificación de imágenes y hemos explorado algunas de sus aplicaciones, veamos cómo puedes probar la clasificación de imágenes con el nuevo modelo YOLO11. Hay dos formas sencillas de empezar: usando el paquete de Python de Ultralytics o a través de Ultralytics HUB. Revisaremos ambas opciones.
Link to this sectionEjecución de inferencias usando YOLO11#
Para empezar con el paquete de Python de Ultralytics, simplemente instálalo usando pip, conda o Docker. Si encuentras algún problema, consulta nuestra Guía de problemas comunes para obtener consejos de solución.
Una vez instalado el paquete, puedes usar el siguiente código para cargar una variante del modelo de clasificación de imágenes YOLO11 y ejecutar una inferencia en una imagen. Ejecutar una inferencia significa usar un modelo entrenado para hacer predicciones sobre datos nuevos y no vistos anteriormente. ¡Puedes probarlo con una imagen de tu elección!

Fig 6. Ejecución de inferencias con el modelo YOLO11.
Link to this sectionEntrenamiento de un modelo de clasificación YOLO11 personalizado#
También puedes usar el mismo paquete de Python para entrenar un modelo de clasificación YOLO11 personalizado. El entrenamiento personalizado te permite ajustar un modelo YOLO11 para tus necesidades específicas. Por ejemplo, si estás desarrollando una aplicación para clasificar diferentes razas de gatos, puedes entrenar un modelo YOLO11 específicamente para ese propósito.
El siguiente código muestra cómo cargar y entrenar un modelo de clasificación de imágenes YOLO11. Te permite transferir pesos preentrenados, usando el conocimiento de un modelo existente para impulsar el rendimiento de tu propio modelo. Puedes especificar un dataset, como el dataset "fashion-mnist", que es un conjunto bien conocido de imágenes en escala de grises de artículos de ropa (camisas, pantalones, zapatos, etc.). Entrenar el modelo con este dataset le enseña a reconocer diferentes categorías de ropa. Puedes cambiar "fashion-mnist" por cualquier dataset que se ajuste a tu proyecto, como razas de gatos o tipos de plantas.

Fig 7. Entrenamiento personalizado de un modelo YOLO11 para la clasificación de imágenes.
Link to this sectionPrueba YOLO11 en Ultralytics HUB#
Aunque usar el paquete de Ultralytics es sencillo, requiere algunos conocimientos de Python. Si buscas una opción más apta para principiantes, puedes usar Ultralytics HUB, una plataforma diseñada para que el entrenamiento y el despliegue de diferentes modelos YOLO sean sencillos y accesibles. Para empezar, tendrás que crear una cuenta.
Una vez que hayas iniciado sesión, dirígete a la sección 'Modelos' y selecciona el modelo YOLO11 para la clasificación de imágenes. Verás una gama de tamaños de modelo disponibles: nano, small, medium, large y extra-large. Después de elegir un modelo, puedes subir una imagen en la sección 'Vista previa', donde las predicciones aparecerán en el lado izquierdo de la página una vez que la imagen sea procesada.

Fig 8. Uso de Ultralytics HUB para ejecutar una inferencia.
Link to this sectionConclusiones clave#
YOLO11 ofrece potentes capacidades de clasificación de imágenes que abren nuevas posibilidades en diversos sectores. Desde mejorar el monitoreo de cultivos en la agricultura y mejorar las búsquedas de productos en el comercio minorista, hasta apoyar la conservación de la vida silvestre, la velocidad y precisión de YOLO11 lo hacen ideal para diversas aplicaciones. Con opciones para entrenamiento personalizado a través del paquete de Python de Ultralytics o una configuración sencilla y sin código en Ultralytics HUB, los usuarios pueden incorporar fácilmente YOLO11 a sus flujos de trabajo. A medida que más sectores adoptan soluciones de IA, YOLO11 ofrece una herramienta flexible y de alto rendimiento que respalda la innovación y los avances prácticos.
Para explorar más, visita nuestro repositorio de GitHub y participa con nuestra comunidad. Explora aplicaciones de IA en coches autónomos y atención sanitaria en nuestras páginas de soluciones. 🚀






