Ejecución de los modelos de detección y segmentación de objetos de Ultralytics en unas pocas líneas de código

Nuvola Ladi

3 min leer

27 de junio de 2024

Una guía paso a paso sobre cómo ejecutar los modelos de detección y segmentación de objetos de Ultralytics en unas pocas líneas de código.

Bienvenidos a otro blogpost en el que nos sumergiremos en las capacidades de los modelos YOLOv5 y YOLOv8 de Ultralytics en lo que respecta a la detección y segmentación de objetos . Exploraremos cómo integrar estos modelos fáciles de usar en sus proyectos con sólo unas pocas líneas de código. Tanto si es un principiante como un desarrollador experimentado, verá cómo Ultralytics es compatible con varios modelos y arquitecturas, incluyendo diferentes versiones de YOLO y modelos basados en transformadores. 

En su vídeo, Nicolai Nielsen nos guía a través del proceso de configuración y uso de varios modelos dentro del marco de Ultralytics. Vamos a desglosarlo paso a paso y a ver cómo puedes empezar a utilizar estas increíbles herramientas.

Introducción a los modelos de Ultralytics

Ultralytics ofrece un marco completo que admite múltiples modelos de detección y segmentación de objetos. Esto incluye los populares modelos YOLO, que van desde YOLOv3 hasta el último YOLOv8, así como los modelos YOLO-NAS y SAM. Estos modelos están diseñados para gestionar diversas tareas, como la detección, la segmentación y la estimación de la pose en tiempo real.

Para empezar, visite la página de documentación de Ultralytics. Aquí encontrarás información detallada sobre cada modelo, incluidas sus características principales, arquitecturas y cómo utilizarlos en tus scripts de Python.

Configuración del entorno

En primer lugar, asegúrese de tener instalado Ultralytics. Puede hacerlo ejecutando:

bash

Copiar código

Una vez hecho esto, puedes empezar a utilizar estos modelos en tus proyectos. Empecemos con el modelo YOLOv8 como ejemplo.

Características principales de YOLOv8

YOLOv8 incorpora varias mejoras con respecto a sus predecesores. Está diseñado para ser más rápido y preciso, lo que lo hace perfecto para aplicaciones en tiempo real. Algunas de sus principales características son: 

  • Mayor velocidad y precisión
  • Pesos preentrenados para múltiples tareas
  • Detección, segmentación y clasificación de objetos
  • Arquitectura del modelo mejorada para un mayor rendimiento

Ejecutar YOLOv8 en Python

A continuación te explicamos cómo puedes empezar a utilizar YOLOv8 con unas pocas líneas de código:

Copiar código

Ya está. Acaba de ejecutar un modelo YOLOv8 en una imagen. Esta simplicidad es lo que hace que los modelos de Ultralytics sean tan potentes y fáciles de usar.

Detección de cámaras web en directo

¿Quieres ver YOLOv8 en acción a través de una webcam en directo? Así es como puedes hacerlo:

python

Copiar código

Este script abrirá tu webcam y aplicará el modelo YOLOv8 para detectar objetos en tiempo real.

__wf_reserved_inherit
Fig. 1. Nicolai Nielsen explica cómo ejecutar los modelos de detección y segmentación de objetos de Ultralytics.

Explorar otros modelos

Ultralytics no se limita a YOLOv8. También es compatible con otros modelos como YOLOv5, YOLO-NAS y modelos basados en transformadores para la detección en tiempo real. Cada modelo tiene sus propios puntos fuertes y casos de uso.

Modelos de transformadores y cómo utilizarlos

El modelo RT-DETR, desarrollado por Baidu y respaldado por Ultralytics, es un detector de objetos integral de última generación que ofrece rendimiento en tiempo real y alta precisión. Utiliza una columna vertebral basada en conv y un codificador híbrido eficiente para la velocidad en tiempo real, destacando en CUDA con TensorRT, y soporta un ajuste flexible de la velocidad de inferencia.

A continuación se explica cómo ejecutar un modelo RT-DETR:

Copiar código

Modelos de todo por segmentos

Ultralytics también ofrece modelos para tareas de segmentación, como MobileSAM y FastSAM. Estos modelos están diseñados para segmentar todo lo que hay en una imagen, proporcionando una visión detallada de la escena.

Ejecutar FastSAM

FastSAM está optimizado para la segmentación en tiempo real, y así es como puede ejecutarlo:

Copiar código

Este modelo es perfecto para aplicaciones que requieren una segmentación rápida y precisa.

Rendimiento y comparaciones

Una de las grandes características de Ultralytics es la posibilidad de comparar diferentes modelos. Puede determinar fácilmente qué modelo funciona mejor para su aplicación específica observando métricas de rendimiento como la velocidad de inferencia y la precisión media (mAP).

Principales conclusiones

Ultralytics hace que sea increíblemente fácil ejecutar modelos de detección y segmentación de objetos con sólo unas pocas líneas de código. Tanto si trabaja en aplicaciones en tiempo real como si necesita modelos de alta precisión, Ultralytics tiene una solución para usted. Asegúrese de consultar el tutorial completo de Nicolai Nielsen en el canal de YouTube de Ultralytics para obtener información más detallada y ejemplos.

Permanezca atento a más tutoriales y actualizaciones de la comunidad Ultralytics.

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Empezar gratis
Enlace copiado en el portapapeles