Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Ultralytics YOLO

Top 5 consejos para desplegar YOLO26 eficientemente en edge y nube

Aprende los 5 mejores consejos prácticos para desplegar Ultralytics YOLO26 de manera eficiente en edge y nube, desde la elección del flujo de trabajo y formato de exportación hasta la cuantización.

ABAbirami Vina4 min read
Consejos para desplegar Ultralytics YOLO26 de manera eficiente en edge y nube

El mes pasado, Ultralytics lanzó oficialmente Ultralytics YOLO26, estableciendo un nuevo estándar para la visión artificial, una rama de la inteligencia artificial que permite a las máquinas interpretar y comprender información visual a partir de imágenes y vídeos. En lugar de limitarse a capturar imágenes, los modelos de visión artificial como los modelos de Ultralytics YOLO admiten tareas de visión como la detección de objetos, la segmentación de instancias, la estimación de pose y la clasificación de imágenes.

Creado para el lugar donde realmente se ejecuta la visión artificial —en dispositivos, cámaras, robots y sistemas de producción—, YOLO26 es un modelo de última generación que ofrece una inferencia más rápida en la unidad central de procesamiento (CPU), una implementación simplificada y un rendimiento integral eficiente en entornos reales. Los modelos YOLO26 también se han diseñado para facilitar el paso de las soluciones de visión artificial de la fase de experimentación a la producción.

El modelo nano de YOLO26 ofrece una inferencia en CPU hasta un 43% más rápida que YOLO11

Fig 1. El modelo YOLO26 nano ofrece una inferencia en CPU hasta un 43% más rápida que YOLO11. (Fuente)

La implementación de modelos suele implicar diversas consideraciones, como seleccionar el hardware adecuado, elegir un formato de exportación apropiado, optimizar el rendimiento y validar los resultados en condiciones reales. Navegar por estos pasos durante la implementación de YOLO26 es sencillo, gracias al paquete de Python de Ultralytics, que agiliza el entrenamiento, la inferencia y la exportación de modelos a través de múltiples destinos de implementación.

Sin embargo, incluso con flujos de trabajo simplificados, tomar las decisiones de implementación correctas es clave. En este artículo, repasaremos cinco consejos prácticos para ayudarte a implementar YOLO26 de manera eficiente en entornos de borde (edge) y de nube, garantizando un rendimiento de visión artificial fiable y escalable en producción. ¡Empecemos!

Link to this section¿Qué es la implementación de modelos en visión artificial?#

Antes de profundizar en las estrategias de implementación para YOLO26, demos un paso atrás y comprendamos qué significa la implementación de modelos en visión artificial.

La implementación de modelos es el proceso de trasladar un modelo de aprendizaje profundo entrenado desde un entorno de desarrollo a una aplicación del mundo real, donde puede procesar nuevas imágenes o transmisiones de vídeo y generar predicciones de forma continua. En lugar de ejecutar experimentos en conjuntos de datos estáticos, el modelo pasa a formar parte de un sistema activo.

En visión artificial, esto a menudo significa integrar el modelo con cámaras, dispositivos de IA de borde (edge AI), APIs o infraestructura en la nube. Debe operar dentro de las limitaciones del hardware, cumplir con los requisitos de latencia y mantener un rendimiento constante bajo condiciones reales cambiantes.

Entender este cambio de la experimentación a la producción es esencial porque las decisiones de implementación afectan directamente al rendimiento de un modelo fuera de un laboratorio o entorno experimental.

Link to this sectionComprender los flujos de trabajo de implementación de Ultralytics YOLO26#

A continuación, veamos qué implica realmente un flujo de trabajo de implementación de YOLO26. En pocas palabras, es la secuencia de pasos que toma una imagen desde su captura hasta que es analizada y convertida en una predicción.

En una configuración típica, una cámara captura una imagen o un fotograma de vídeo. A continuación, esos datos se preprocesan, por ejemplo, cambiando su tamaño o formateándolos correctamente, antes de enviarlos a Ultralytics YOLO26 para la inferencia.

El modelo analiza la entrada y genera salidas como cuadros delimitadores (BBox), máscaras de segmentación o puntos clave. Estos resultados pueden utilizarse para activar acciones, como enviar alertas, actualizar un panel de control o guiar un sistema robótico.

Dónde se ejecute este flujo de trabajo dependerá de tu estrategia de implementación. Por ejemplo, en una implementación en el borde (edge), la inferencia ocurre directamente en el dispositivo o cerca de la cámara, lo que ayuda a reducir la latencia y mejorar la privacidad de los datos.

Mientras tanto, en una implementación en la nube, las imágenes o los fotogramas de vídeo se envían a servidores remotos para su procesamiento, lo que permite una mayor escalabilidad y una gestión centralizada. Algunos sistemas utilizan un enfoque híbrido, realizando un procesamiento ligero en el borde (edge) y cargas de trabajo más pesadas en la nube.

Link to this sectionExplorando las variantes del modelo YOLO26#

Para tomar decisiones de implementación informadas, también es importante entender que existen diferentes variantes del modelo YOLO26 entre las que elegir.

Desde el primer momento, los modelos YOLO de Ultralytics están disponibles en varios tamaños, lo que facilita la elección de una versión que se adapte a tus necesidades de hardware y rendimiento. YOLO26 viene en cinco variantes: Nano (n), Small (s), Medium (m), Large (l) y Extra Large (x).

Los modelos más pequeños, como YOLO26n, están optimizados para la eficiencia y son ideales para dispositivos de borde (edge), dispositivos de Internet de las Cosas (IoT), sistemas integrados y sistemas alimentados por una CPU, donde la baja latencia y el menor consumo de energía son importantes. Ofrecen un rendimiento sólido manteniendo un uso mínimo de recursos.

Los modelos más grandes, como YOLO26l y YOLO26x, están diseñados para ofrecer una mayor precisión y manejar escenas más complejas. Estas variantes suelen funcionar mejor en sistemas equipados con unidades de procesamiento gráfico (GPU) o en entornos de nube donde hay más recursos informáticos disponibles.

Seleccionar el tamaño de modelo adecuado depende de tus objetivos de implementación. Si la velocidad y la eficiencia en hardware limitado son tus prioridades principales, una variante más pequeña puede ser ideal. Si tu aplicación exige la máxima precisión y tienes acceso a un hardware más potente, un modelo más grande puede ser la mejor opción.

Link to this sectionConsejos para implementar YOLO26 de forma eficiente#

Ahora que entendemos mejor las variantes del modelo YOLO26 y los flujos de trabajo de implementación, exploremos algunos consejos prácticos para implementar YOLO26 de manera eficiente en entornos de borde (edge) y de nube.

Link to this sectionConsejo 1: Considera tus opciones de implementación de modelos#

Una de las primeras decisiones que deberás tomar al implementar Ultralytics YOLO26 es dónde se ejecutará el modelo. Tu entorno de implementación afecta directamente al rendimiento, la latencia, la privacidad y la escalabilidad.

Empieza evaluando tu flujo de trabajo. ¿Tu aplicación requiere una latencia baja, lo que significa que las predicciones deben generarse casi instantáneamente después de que se captura una imagen?

Por ejemplo, en robótica o en sistemas de seguridad, incluso pequeños retrasos pueden afectar al rendimiento. En estos casos, una implementación en el borde (edge) suele ser la mejor opción. Ejecutar la inferencia directamente en un dispositivo o cerca de la cámara reduce el tiempo necesario para procesar los datos y evita enviar imágenes a través de Internet, lo que también puede mejorar la privacidad.

Por otro lado, la implementación en la nube proporciona una mayor escalabilidad y potencia de computación. Los servidores en la nube pueden procesar grandes volúmenes de imágenes, manejar múltiples flujos de vídeo y admitir un mayor rendimiento.

Por ejemplo, en la agricultura, un agricultor podría recolectar miles de imágenes de hojas y analizarlas en lotes para determinar si los cultivos muestran signos de enfermedad. En este tipo de escenario, es posible que no se requiera un rendimiento inmediato en tiempo real, lo que convierte al procesamiento en la nube en una opción práctica y escalable.

Un ejemplo del uso de YOLO26 para analizar imágenes de hojas

Fig 2. Un ejemplo de uso de YOLO26 para analizar imágenes de hojas

Sin embargo, el envío de datos a servidores remotos introduce latencia de red, que es el retraso causado por la transmisión de imágenes a través de Internet y la recepción de predicciones a cambio. Para aplicaciones que no son sensibles al tiempo, este compromiso puede ser aceptable.

También hay opciones entre el borde (edge) puro y la nube pura. Algunas empresas utilizan infraestructura local (on-premise) ubicada cerca de donde se generan los datos. Otras construyen tuberías (pipelines) híbridas, realizando un filtrado ligero en el borde y enviando datos seleccionados a la nube para un análisis más profundo.

Elegir la opción de implementación adecuada depende de los requisitos de tu aplicación. Al definir claramente tus necesidades de velocidad, privacidad y escalabilidad, puedes seleccionar una estrategia que garantice que YOLO26 funcione de forma fiable en condiciones reales.

Link to this sectionConsejo 2: Elige el formato de exportación que coincida con tu hardware#

Una vez que hayas decidido dónde se ejecutará tu modelo, el siguiente paso es elegir el formato de exportación correcto. Exportar un modelo significa convertirlo desde el formato utilizado durante el entrenamiento a un formato optimizado para la implementación.

Los modelos YOLO26 se crean y entrenan de forma nativa en PyTorch, pero los entornos de producción a menudo dependen de entornos de ejecución especializados que son más adecuados para un hardware específico. Estos entornos de ejecución están diseñados para mejorar la velocidad de inferencia, reducir el uso de memoria y garantizar la compatibilidad con el dispositivo de destino.

Convertir YOLO26 al formato apropiado le permite ejecutarse de forma eficiente fuera del entorno de entrenamiento. El paquete de Python de Ultralytics hace que este proceso sea sencillo. Admite una amplia gama de integraciones para crear e implementar proyectos de visión artificial.

Si deseas explorar estas integraciones con más detalle, puedes consultar la documentación oficial de Ultralytics. Incluye tutoriales paso a paso, orientación específica para el hardware y ejemplos prácticos para ayudarte a pasar del desarrollo a la producción con confianza.

Ultralytics es compatible con diferentes integraciones

Fig 3. Ultralytics admite diferentes integraciones (Fuente)

En particular, el paquete de Python de Ultralytics permite exportar Ultralytics YOLO26 a múltiples formatos adaptados a diferentes plataformas de hardware. Por ejemplo, el formato de exportación ONNX permite la compatibilidad multiplataforma, el formato de exportación TensorRT está optimizado para GPU NVIDIA y dispositivos de borde (edge) NVIDIA Jetson, y el formato de exportación OpenVINO está diseñado para hardware Intel.

Algunos dispositivos admiten más de un formato de exportación, pero el rendimiento puede variar según el que elijas. En lugar de seleccionar un formato por defecto, pregúntate: ¿qué opción es la más eficiente para tu dispositivo?

Un formato puede ofrecer una inferencia más rápida, mientras que otro puede ofrecer una mejor eficiencia de memoria o una integración más fácil en tu tubería (pipeline) existente. Por eso es importante hacer coincidir el formato de exportación con tu hardware y entorno de implementación específicos.

Dedicar tiempo a probar diferentes opciones de exportación en tu dispositivo de destino puede marcar una diferencia notable en el rendimiento real. Un formato de exportación bien adaptado ayuda a garantizar que YOLO26 se ejecute de forma eficiente, fiable y a la velocidad que requiere tu aplicación.

Link to this sectionConsejo 3: Pregúntate si tu modelo necesita cuantización#

Después de seleccionar un formato de exportación, también es una buena idea determinar si tu modelo debe cuantizarse.

La cuantización de modelos reduce la precisión numérica de los pesos y los cálculos de un modelo, convirtiéndolos normalmente de coma flotante de 32 bits a formatos de menor precisión, como 16 bits o 8 bits. Esto ayuda a reducir el tamaño del modelo, disminuir el uso de memoria y mejorar la velocidad de inferencia, especialmente en dispositivos de borde (edge) o sistemas alimentados por una CPU.

Dependiendo de tu hardware, formato de exportación y dependencias del entorno de ejecución, la cuantización puede mejorar notablemente el rendimiento. Algunos entornos de ejecución están optimizados para modelos de menor precisión, lo que les permite ejecutarse de forma más rápida y eficiente.

Sin embargo, la cuantización puede afectar ligeramente a la precisión si no se aplica con cuidado. Al realizar la cuantización posterior al entrenamiento, asegúrate de pasar las imágenes de validación. Estas imágenes se utilizan durante la calibración para ayudar al modelo a ajustarse a una menor precisión y mantener predicciones estables.

Link to this sectionConsejo 4: Ten en cuenta la deriva de datos (data drift)#

Incluso el modelo mejor entrenado puede perder rendimiento con el tiempo debido a la deriva de datos. La deriva de datos ocurre cuando los datos que ve tu modelo en producción son diferentes de los datos con los que fue entrenado.

En otras palabras, el mundo real cambia, pero tu modelo no. Como resultado, la precisión puede disminuir lentamente.

Por ejemplo, podrías entrenar tu modelo YOLO26 utilizando imágenes capturadas durante el día. Si ese mismo modelo se utiliza más tarde por la noche, bajo condiciones de iluminación diferentes, el rendimiento puede caer. El mismo problema puede ocurrir con cambios en los ángulos de la cámara, condiciones meteorológicas, fondos o apariencias de los objetos.

La deriva de datos es común en los sistemas de visión artificial del mundo real. Los entornos rara vez son estáticos y los pequeños cambios pueden afectar a la precisión de la detección. Para reducir el impacto de la deriva, puedes asegurarte de que tu conjunto de datos de entrenamiento refleje las condiciones del mundo real lo más fielmente posible.

Incluye imágenes capturadas en diferentes momentos del día, bajo diferentes condiciones de iluminación y a través de diversos entornos. Después de la implementación, puedes seguir supervisando el rendimiento y actualizando o ajustando el modelo cuando sea necesario.

Link to this sectionConsejo 5: Realiza pruebas comparativas (benchmarking) en condiciones reales#

Antes de implementar completamente tu modelo, puedes realizar pruebas comparativas en condiciones reales.

Evaluación comparativa de YOLO26 frente a otros modelos

Fig 4. Un vistazo a la comparación de YOLO26 frente a otros modelos (Fuente)

Es común probar el rendimiento en entornos controlados utilizando imágenes de muestra o pequeños conjuntos de datos. Sin embargo, los sistemas del mundo real suelen comportarse de manera diferente. Las limitaciones del hardware, los retrasos en la red, los múltiples flujos de vídeo y la entrada continua pueden afectar al rendimiento.

Las pruebas comparativas (benchmarking) se refieren a medir cómo funciona tu modelo en el dispositivo y la configuración reales donde se ejecutará. Esto incluye comprobar la velocidad de inferencia, la latencia general, el uso de memoria y la estabilidad del sistema. Es importante probar no solo el modelo en sí, sino toda la tubería (pipeline), incluidos el preprocesamiento y cualquier paso de postprocesamiento.

Un modelo puede funcionar bien en una prueba de imagen única, pero tener dificultades al procesar vídeo en directo de forma continua. Del mismo modo, el rendimiento en una potente máquina de desarrollo puede no reflejar cómo se comporta el modelo en un dispositivo de borde (edge) de baja potencia.

Al realizar pruebas comparativas en condiciones realistas, puedes identificar cuellos de botella desde el principio y realizar ajustes antes de entrar en funcionamiento. Probar en el mismo entorno en el que operará YOLO26 ayuda a garantizar un rendimiento fiable, estable y consistente en producción.

Link to this sectionOtras consideraciones clave para la implementación de modelos#

Aquí hay algunos factores adicionales a tener en cuenta al implementar YOLO26:

  • Supervisión y registro: Configura herramientas de supervisión para realizar un seguimiento de métricas como la latencia, la precisión y la salud del sistema después de la implementación.
  • Seguridad y privacidad: Implementa salvaguardas para proteger los datos visuales confidenciales, especialmente al utilizar la nube o infraestructura remota.
  • Optimización de los cuellos de botella de la tubería (pipeline): Evalúa toda la tubería, incluidos los módulos como el preprocesamiento, la inferencia, el postprocesamiento y la transferencia de datos, ya que los retrasos pueden ocurrir fuera del modelo mismo.
  • Planificación de la escalabilidad: Planifica con antelación el crecimiento asegurándote de que tu sistema pueda manejar un mayor tráfico, cámaras adicionales o cargas de trabajo expandidas.

Link to this sectionConclusiones clave#

La implementación eficiente de YOLO26 comienza con la comprensión de dónde se ejecutará tu modelo y qué necesita realmente tu aplicación. Al elegir el enfoque de implementación correcto, hacer coincidir el formato de exportación con tu hardware y probar el rendimiento en condiciones reales, puedes construir sistemas de visión artificial fiables y receptivos. Con la configuración adecuada, Ultralytics YOLO26 facilita la incorporación de una visión artificial rápida y lista para la producción en el borde (edge) y en la nube.

Únete a nuestra comunidad y explora nuestro repositorio de GitHub. Echa un vistazo a nuestras páginas de soluciones para descubrir diversas aplicaciones como la IA en la agricultura y la visión artificial en el sector sanitario. ¡Descubre nuestras opciones de licencia y empieza hoy mismo con la visión artificial!

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático