Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Computación sin Servidor

Descubra cómo la computación sin servidor simplifica la implementación de la IA. Aprenda a crear flujos de trabajo escalables y rentables utilizando Ultralytics para una inferencia eficiente de ML.

La computación sin servidor es un modelo de ejecución en la nube que permite a los desarrolladores crear y ejecutar aplicaciones sin la complejidad de gestionar la infraestructura. En este paradigma, el proveedor de la nube gestiona dinámicamente la asignación y el aprovisionamiento de servidores, abstrayendo el hardware y los sistemas operativos subyacentes del usuario. El código se ejecuta en contenedores sin estado activados por eventos específicos, como una solicitud HTTP, una modificación de la base de datos o una carga de archivos. Este enfoque es muy relevante para las modernas estrategias de computación en la nube, ya que permite a las organizaciones pagar solo por el tiempo de computación consumido, adhiriéndose automáticamente a los requisitos de escalabilidad al expandirse de cero a miles de instancias en función de la demanda de tráfico.

La mecánica de la tecnología sin servidor para la IA

En el núcleo de la computación sin servidor se encuentra el concepto de Función como servicio (FaaS), en el que las aplicaciones se desglosan en funciones individuales que realizan tareas discretas. Para los profesionales del aprendizaje automático (ML), esto ofrece una vía optimizada para la implementación de modelos. En lugar de mantener un servidor dedicado que permanece inactivo durante los periodos de poco tráfico, una función sin servidor puede activarse bajo demanda para procesar datos y apagarse inmediatamente después.

Sin embargo, una consideración clave en esta arquitectura es el «arranque en frío», es decir, la latencia que se produce cuando se invoca una función por primera vez o tras un periodo de inactividad. Para mitigar esto, los desarrolladores suelen utilizar arquitecturas ligeras como YOLO26 o técnicas como la cuantificación de modelos para garantizar tiempos de carga rápidos , lo cual es esencial para mantener una baja latencia de inferencia.

Aplicaciones reales del aprendizaje automático

Las arquitecturas sin servidor son especialmente eficaces para los flujos de trabajo de visión artificial (CV) y los procesos de datos basados en eventos.

  • Preprocesamiento automatizado de datos: cuando un usuario carga un conjunto de datos sin procesar en un servicio de almacenamiento como Amazon S3, puede activar una función sin servidor para realizar un preprocesamiento inmediato de los datos. La función puede cambiar el tamaño de las imágenes, normalizar los valores de píxeles o validar los formatos de archivo antes de que los datos entren en un canal de datos de entrenamiento, lo que garantiza la coherencia sin intervención manual.
  • Vigilancia inteligente bajo demanda: en AI in Security, un sensor de movimiento puede activar una cámara para capturar una imagen. Este evento invoca una función en la nube que aloja un modelo de detección de objetos. El modelo analiza la imagen para distinguir entre un animal inofensivo y un posible intruso, enviando una alerta solo cuando es necesario. Esto reduce drásticamente los costes de ancho de banda y almacenamiento en comparación con la transmisión continua.

Ejemplo Python : Gestor de inferencias sin servidor

El siguiente código muestra un controlador sin servidor conceptual. Inicializa una instancia de modelo global para aprovechar las «inicializaciones en caliente» (en las que el contenedor permanece activo entre solicitudes) y procesa una ruta de imagen entrante .

from ultralytics import YOLO

# Initialize the model outside the handler to cache it for subsequent requests
# YOLO26n is ideal for serverless due to its compact size and speed
model = YOLO("yolo26n.pt")


def lambda_handler(event, context):
    """Simulates a serverless function handler triggered by an event. 'event' represents the input payload containing
    the image source.
    """
    image_source = event.get("url", "https://ultralytics.com/images/bus.jpg")

    # Perform inference
    results = model(image_source)

    # Return prediction summary
    return {
        "statusCode": 200,
        "body": {
            "objects_detected": len(results[0].boxes),
            "top_class": results[0].names[int(results[0].boxes.cls[0])] if len(results[0].boxes) > 0 else "None",
        },
    }

Distinción de tecnologías afines

Para comprender la computación sin servidor es necesario diferenciarla de otros modelos de infraestructura que se utilizan a menudo en MLOps.

  • Computación sin servidor frente a computación periférica: aunque ambas tienen como objetivo optimizar la eficiencia, operan en ubicaciones diferentes. La computación periférica procesa los datos localmente en el dispositivo (por ejemplo, una cámara inteligente o un dispositivo IoT) para minimizar el tiempo de tránsito por la red. La computación sin servidor se produce en una nube pública centralizada. Las soluciones híbridas suelen procesar los datos iniciales en el perímetro y enviar las anomalías complejas a funciones de nube sin servidor para un análisis más profundo de las imágenes médicas o una revisión forense.
  • Sin servidor frente a Kubernetes: Kubernetes es una plataforma de orquestación para la contenedorización que ofrece a los desarrolladores un control granular sobre el entorno del clúster, las redes y los pods. Aunque es potente, requiere una importante sobrecarga de gestión. Las plataformas sin servidor, como Google Functions o Azure Functions, abstraen esta orquestación por completo, lo que permite a los equipos centrarse únicamente en la lógica del código en lugar de en el estado de los nodos.
  • Sin servidor frente a IaaS: La infraestructura como servicio (IaaS) proporciona recursos informáticos virtualizados a través de Internet, como Amazon EC2. Con IaaS, el usuario es responsable de aplicar parches al sistema operativo y gestionar el middleware. Por el contrario, la informática sin servidor elimina estas responsabilidades operativas, lo que permite a los desarrolladores centrarse en tareas de mayor nivel, como mejorar la precisión de la clasificación de imágenes.

Al aprovechar las arquitecturas sin servidor, los desarrolladores pueden implementar soluciones de IA robustas que son rentables y capaces de manejar cargas de trabajo impredecibles, utilizando herramientas como la Ultralytics para optimizar el proceso de gestión y entrenamiento de modelos antes de la implementación.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora