Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Implementación de modelos

Descubre los aspectos esenciales de la implementación de modelos, transformando los modelos de ML en herramientas del mundo real para predicciones, automatización e insights impulsados por la IA.

El despliegue de modelos es el proceso crítico de integrar un modelo de aprendizaje automático (ML) entrenado en un entorno de producción en vivo donde puede recibir entradas y proporcionar predicciones. Es la etapa final en el ciclo de vida del aprendizaje automático, transformando un archivo de modelo estático en una aplicación funcional que genera valor. Sin un despliegue eficaz, incluso el modelo más preciso es solo un ejercicio académico. El objetivo es hacer que el poder predictivo del modelo sea accesible para los usuarios finales, las aplicaciones de software u otros sistemas automatizados de una manera fiable y escalable.

¿Cuál es el proceso de implementación?

Implementar un modelo implica más que simplemente guardar los pesos del modelo entrenado. Es un proceso de varios pasos que garantiza que el modelo funcione de manera eficiente y confiable en su entorno objetivo.

  1. Optimización de modelos: Antes de la implementación, los modelos se optimizan a menudo para la velocidad y el tamaño. Técnicas como la cuantización de modelos y la poda de modelos reducen los recursos computacionales necesarios para la inferencia en tiempo real sin una caída significativa en la precisión.
  2. Exportación de modelos: El modelo optimizado se convierte entonces en un formato adecuado para la plataforma de destino. Los modelos de Ultralytics, por ejemplo, pueden exportarse a varios formatos como ONNX, TensorRT y CoreML, lo que los hace muy versátiles.
  3. Empaquetado: El modelo y todas sus dependencias (como bibliotecas y frameworks específicos) se empaquetan juntos. La contenedorización utilizando herramientas como Docker es una práctica común, ya que crea un entorno autocontenido y portátil que garantiza que el modelo se ejecute de forma consistente en todas partes.
  4. Serving (Servicio): El modelo empaquetado se implementa en un servidor o dispositivo donde puede aceptar solicitudes a través de una API. Este componente, conocido como model serving (servicio de modelos), es responsable de gestionar los datos entrantes y devolver las predicciones.
  5. Monitoreo: Después de la implementación, el monitoreo del modelo continuo es esencial. Esto implica el seguimiento de las métricas de rendimiento, la latencia y el uso de recursos para garantizar que el modelo funcione como se espera y para detectar problemas como la deriva de datos.

Entornos de implementación

Los modelos se pueden implementar en una variedad de entornos, cada uno con sus propias ventajas y desafíos.

  • Plataformas en la nube: Servicios como Amazon Web Services (AWS), Google Cloud Platform (GCP) y Microsoft Azure ofrecen una infraestructura potente y escalable para alojar modelos complejos.
  • Servidores On-Premises: Las organizaciones con estrictos requisitos de privacidad de datos o aquellas que necesitan un control total sobre su infraestructura pueden implementar modelos en sus propios servidores.
  • Dispositivos Edge AI: Edge AI implica implementar modelos directamente en hardware local, como teléfonos inteligentes, drones, sensores industriales o dispositivos especializados como el NVIDIA Jetson. Este enfoque es ideal para aplicaciones que requieren baja latencia de inferencia y capacidades fuera de línea.
  • Navegadores Web: Los modelos se pueden ejecutar directamente en un navegador web utilizando frameworks como TensorFlow.js, lo que permite experiencias de IA interactivas sin procesamiento del lado del servidor.

Aplicaciones en el mundo real

  • Control de Calidad en la Fabricación: Un modelo Ultralytics YOLO entrenado para la detección de defectos puede ser implementado en un dispositivo edge en una planta de fábrica. El modelo, optimizado con TensorRT para un alto rendimiento, se integra con una cámara que supervisa una cinta transportadora. Realiza detección de objetos en tiempo real para identificar productos defectuosos, señalando instantáneamente a un brazo robótico para que los retire. Todo este proceso ocurre localmente, minimizando la latencia de la red y asegurando una acción inmediata. Para obtener más información, consulte cómo se aplica la IA en la fabricación.
  • Análisis inteligente de la venta minorista: Un modelo de visión artificial para el conteo y seguimiento de personas se implementa en servidores en la nube. Las cámaras en una tienda minorista transmiten vídeo a la nube, donde el modelo procesa las transmisiones para generar mapas de calor del flujo de clientes y analizar los patrones de compra. La aplicación se gestiona con Kubernetes para gestionar las diferentes cargas de varias tiendas, proporcionando información valiosa para la gestión del inventario y la optimización de la distribución de la tienda.

Despliegue de modelos, Model Serving y MLOps

Si bien están estrechamente relacionados, estos términos son distintos.

  • Implementación de modelos vs. Model Serving: La implementación es todo el proceso de extremo a extremo de tomar un modelo entrenado y hacerlo operativo. El Model Serving es un componente específico de la implementación que se refiere a la infraestructura responsable de ejecutar el modelo y responder a las solicitudes de predicción, a menudo a través de una API.
  • Implementación de modelos vs. MLOps: Machine Learning Operations (MLOps) es un amplio conjunto de prácticas que abarca todo el ciclo de vida de la IA. La implementación es una fase crítica dentro del marco de MLOps, que también incluye la gestión de datos, el entrenamiento de modelos, el control de versiones y la supervisión y el reentrenamiento continuos. Plataformas como Ultralytics HUB proporcionan un entorno integrado para gestionar todo este flujo de trabajo, desde el entrenamiento de modelos personalizados hasta la implementación y supervisión sin problemas.

Únete a la comunidad de Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora
Enlace copiado al portapapeles