Cómo usar Ultralytics YOLO11 para la detección de objetos
Explora cómo se puede utilizar el nuevo modelo Ultralytics YOLO11 para la detección de objetos para lograr una mayor precisión en diversas aplicaciones en una variedad de industrias.

La visión artificial es un campo de la inteligencia artificial (IA) que ayuda a las máquinas a interpretar y comprender la información visual para permitir tareas esenciales como la detección de objetos. A diferencia de la clasificación de imágenes, la detección de objetos no solo identifica qué objetos hay en una imagen, sino que también señala sus ubicaciones exactas. Esto la convierte en una herramienta fundamental para aplicaciones de visión artificial como los coches autónomos, los sistemas de seguridad en tiempo real y la automatización de almacenes.
Con el tiempo, la tecnología de detección de objetos se ha vuelto más avanzada y fácil de usar. Un gran paso adelante se anunció en el evento híbrido anual de Ultralytics, YOLO Vision 2024 (YV24), con el lanzamiento del modelo Ultralytics YOLO11. YOLO11 mejora la precisión y el rendimiento a la vez que admite las mismas tareas que YOLOv8, lo que facilita a los usuarios de modelos anteriores una transición sin problemas.

Fig 1. Un ejemplo de uso del modelo Ultralytics YOLO11 para la detección de objetos.
En este artículo, desglosaremos qué es la detección de objetos, en qué se diferencia de otras tareas de visión artificial y exploraremos sus aplicaciones en el mundo real. También te guiaremos sobre cómo usar el modelo YOLO11 con el paquete de Python de Ultralytics y la plataforma Ultralytics HUB. ¡Comencemos!
Link to this section¿Qué es la detección de objetos?#
La detección de objetos es una tarea central en la visión artificial que hace algo más que identificar objetos en una imagen. A diferencia de la clasificación de imágenes, que solo determina si un objeto específico está presente, la detección de objetos reconoce múltiples objetos y señala sus ubicaciones exactas mediante cuadros delimitadores.
Por ejemplo, puede identificar y localizar rostros en una foto de grupo, coches en una calle concurrida o productos en un estante de una tienda. Combinar el reconocimiento y la localización de objetos la hace especialmente útil para aplicaciones como la vigilancia, el control de multitudes y la gestión automatizada de inventario.

Fig 2. Uso de YOLO11 para detectar rostros.
Lo que distingue a la detección de objetos de otras tareas como la segmentación semántica o de instancias es su enfoque y eficiencia.
La segmentación semántica etiqueta cada píxel de una imagen, pero no diferencia entre objetos individuales del mismo tipo (por ejemplo, todos los rostros de una foto se agruparían como "rostro"). La segmentación de instancias va más allá al separar cada objeto y delinear su forma exacta, incluso para objetos de la misma clase.
La detección de objetos, sin embargo, ofrece un enfoque más ágil al identificar y clasificar objetos mientras marca sus posiciones. Esto la hace ideal para tareas en tiempo real como detectar rostros en imágenes de seguridad o identificar obstáculos para vehículos autónomos.
Link to this sectionAplicaciones de YOLO11 y la detección de objetos#
Las funciones avanzadas de detección de objetos de YOLO11 la hacen útil en muchos sectores. Echemos un vistazo a algunos ejemplos.
Link to this sectionUso de YOLO11 para análisis minorista#
YOLO11 y la detección de objetos están redefiniendo el análisis minorista al hacer que la gestión de inventario y el monitoreo de estantes sean más eficientes y precisos. La capacidad del modelo para detectar objetos de forma rápida y fiable ayuda a los minoristas a realizar un seguimiento de los niveles de existencias, organizar los estantes y reducir los errores en los recuentos de inventario.
Por ejemplo, YOLO11 puede detectar artículos específicos como gafas de sol en el estante de una tienda. Pero, ¿por qué un minorista querría monitorear un estante? Mantener los estantes abastecidos y organizados es vital para asegurar que los clientes puedan encontrar lo que necesitan, lo que afecta directamente a las ventas. Al monitorear los estantes en tiempo real, los minoristas pueden detectar rápidamente cuándo los artículos escasean, están mal colocados o hay exceso de productos, ayudándoles a mantener una exhibición organizada y atractiva que mejora la experiencia de compra.

Fig 3. Un ejemplo de uso de YOLO11 para detectar productos en estantes.
Link to this sectionYOLO11 en aplicaciones de ciudades inteligentes#
Una ciudad bulliciosa depende de un flujo de tráfico fluido y calles seguras para funcionar de manera eficiente, y YOLO11 puede ayudar a hacerlo posible. De hecho, muchas aplicaciones de ciudades inteligentes se pueden integrar con YOLO11.
Un caso interesante implica el uso de la detección de objetos para identificar matrículas en vehículos en movimiento. Al hacerlo, YOLO11 puede respaldar un cobro de peaje más rápido, una mejor gestión del tráfico y un cumplimiento normativo más ágil.

Fig 4. Uso de detección de objetos y YOLO11 para detectar matrículas.
Los conocimientos obtenidos de los sistemas de visión artificial que monitorean las carreteras pueden alertar a las autoridades sobre infracciones de tráfico o congestión antes de que se conviertan en problemas mayores. YOLO11 también puede detectar peatones y ciclistas, haciendo que las calles sean más seguras y eficientes para todos.
De hecho, la capacidad de YOLO11 para procesar datos visuales la convierte en una herramienta poderosa para mejorar la infraestructura de la ciudad. Por ejemplo, puede ayudar a optimizar la sincronización de los semáforos analizando el movimiento de vehículos y peatones. También puede mejorar la seguridad en las zonas escolares al detectar a niños y alertar a los conductores para que reduzcan la velocidad. Con YOLO11, las ciudades pueden tomar medidas proactivas para abordar los desafíos y crear un entorno más eficiente para todos.
Link to this sectionDetección de vídeo en tiempo real con YOLO11: mayor accesibilidad#
La detección de objetos en tiempo real se refiere a la capacidad de un sistema para identificar y clasificar objetos en una transmisión de vídeo en directo a medida que aparecen. YOLO11 está diseñado para un rendimiento superior en tiempo real y destaca en el soporte de esta capacidad. Sus aplicaciones van más allá de agilizar los procesos: también puede ayudar a crear un mundo más inclusivo y accesible.
Por ejemplo, YOLO11 puede ayudar a las personas con discapacidad visual identificando objetos en tiempo real. Basándose en las detecciones, se pueden proporcionar descripciones de audio, lo que ayuda a los usuarios a navegar por su entorno con mayor independencia.
Considera a una persona con discapacidad visual comprando comestibles. Elegir los artículos adecuados puede ser un desafío, pero YOLO11 puede ayudar. A medida que colocan artículos en su carrito, se podría usar un sistema integrado con YOLO11 para identificar cada artículo (como plátanos, aguacates o un cartón de leche) y proporcionar descripciones de audio en tiempo real. Esto les permite confirmar sus elecciones y asegurarse de que tienen todo lo que necesitan. Al reconocer artículos cotidianos, YOLO11 puede simplificar la compra.

Fig 5. La detección de objetos puede ayudar a hacer el mundo más accesible para personas con discapacidad visual.
Link to this sectionGuía paso a paso para la detección de objetos con YOLO11#
Ahora que hemos cubierto los conceptos básicos de la detección de objetos y sus diversas aplicaciones, profundicemos en cómo puedes empezar a usar el modelo Ultralytics YOLO11 para tareas como la detección de objetos.
Hay dos formas sencillas de usar YOLO11: a través del paquete de Python de Ultralytics o Ultralytics HUB. Exploremos ambos métodos, empezando por el paquete de Python.
Link to this sectionEjecución de inferencias usando YOLO11#
La inferencia es cuando un modelo de IA analiza datos nuevos y desconocidos para hacer predicciones, clasificar información o proporcionar información basada en lo que aprendió durante el entrenamiento. Con respecto a la detección de objetos, eso significa identificar y localizar objetos específicos dentro de una imagen o vídeo, dibujar cuadros delimitadores alrededor de ellos y etiquetarlos según el entrenamiento del modelo.
Para realizar inferencias usando el modelo de detección de objetos YOLO11, primero necesitarás instalar el paquete de Python de Ultralytics a través de pip, conda o Docker. Si encuentras algún problema de instalación, consulta la guía de resolución de problemas para obtener consejos y trucos que te ayuden a solucionarlos. Una vez instalado, puedes usar el siguiente código para cargar el modelo de detección de objetos YOLO11 y hacer predicciones sobre una imagen.

Fig 6. Ejecución de una inferencia en una imagen usando YOLO11n.
Link to this sectionEntrenamiento de un modelo YOLO11 personalizado#
YOLO11 también admite el entrenamiento personalizado para adaptarse mejor a tus casos de uso específicos. Al ajustar el modelo, puedes adaptarlo para detectar objetos relevantes para tu proyecto. Por ejemplo, al usar visión artificial en la atención médica, se podría utilizar un modelo YOLO11 entrenado de forma personalizada para detectar anomalías específicas en imágenes médicas, como tumores en resonancias magnéticas o fracturas en radiografías, ayudando a los médicos a realizar diagnósticos más rápidos y precisos.
El fragmento de código a continuación muestra cómo cargar y entrenar un modelo YOLO11 para la detección de objetos. Puedes empezar desde un archivo de configuración YAML o un modelo preentrenado, transferir pesos y entrenar en conjuntos de datos como COCO para obtener capacidades de detección de objetos más refinadas.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.yaml") # build a new model from YAML
model = YOLO("yolo11n.pt") # load a pretrained model (recommended for training)
model = YOLO("yolo11n.yaml").load("yolo11n.pt") # build from YAML and transfer weights
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)Después de entrenar un modelo, también puedes exportarlo en varios formatos para su despliegue en diferentes entornos.
Link to this sectionDetección de objetos YOLO11 en Ultralytics HUB#
Para aquellos que buscan una alternativa sin código, Ultralytics HUB proporciona una plataforma de visión artificial fácil de usar para entrenar y desplegar modelos YOLO, incluido YOLO11.
Para ejecutar la detección de objetos en imágenes, simplemente crea una cuenta, navega a la sección 'Models' (Modelos) y selecciona la variante del modelo de detección de objetos YOLO11. Sube tu imagen y la plataforma mostrará los objetos detectados en una sección de vista previa.

Fig 7. Ejecución de inferencias en Ultralytics HUB.
Al combinar la flexibilidad del paquete de Python con la facilidad del HUB, YOLO11 facilita tanto a los desarrolladores como a las empresas aprovechar el poder de la tecnología avanzada de detección de objetos.
Link to this sectionConclusiones clave#
YOLO11 establece un nuevo estándar en la detección de objetos, combinando alta precisión con versatilidad para satisfacer las necesidades de varios sectores. Desde mejorar el análisis minorista hasta gestionar la infraestructura de ciudades inteligentes, YOLO11 está diseñado para un rendimiento fiable en tiempo real en innumerables aplicaciones.
Con opciones para entrenamiento personalizado y una interfaz fácil de usar a través de Ultralytics HUB, integrar YOLO11 en tus flujos de trabajo nunca ha sido tan sencillo. Tanto si eres un desarrollador que explora la visión artificial como si eres una empresa que busca innovar con IA, YOLO11 ofrece las herramientas que necesitas para tener éxito.
Para obtener más información, consulta nuestro repositorio de GitHub e interactúa con nuestra comunidad. Explora las aplicaciones de IA en coches autónomos y visión artificial para la agricultura en nuestras páginas de soluciones. 🚀






