Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Computación sin Servidor

Explore how serverless computing simplifies AI model deployment. Learn to build scalable, cost-effective workflows using [YOLO26](https://docs.ultralytics.com/models/yolo26/) for efficient cloud inference.

Serverless computing is a cloud execution model that enables developers to build and run applications without the complexity of managing infrastructure. In this paradigm, the cloud provider dynamically manages the allocation and provisioning of servers, abstracting the underlying hardware and operating systems away from the user. Code is executed in stateless containers triggered by specific events, such as an HTTP request, a database modification, or a file upload. This approach is highly relevant to modern cloud computing strategies, as it allows organizations to pay only for the compute time consumed, automatically adhering to scalability requirements by expanding from zero to thousands of instances based on traffic demand.

La mecánica de la tecnología sin servidor para la IA

En el núcleo de la computación sin servidor se encuentra el concepto de Función como servicio (FaaS), en el que las aplicaciones se desglosan en funciones individuales que realizan tareas discretas. Para los profesionales del aprendizaje automático (ML), esto ofrece una vía optimizada para la implementación de modelos. En lugar de mantener un servidor dedicado que permanece inactivo durante los periodos de poco tráfico, una función sin servidor puede activarse bajo demanda para procesar datos y apagarse inmediatamente después.

However, a key consideration in this architecture is the "cold start"—the latency incurred when a function is invoked for the first time or after a period of inactivity. To mitigate this, developers often use lightweight architectures like YOLO26 or techniques like model quantization to ensure rapid loading times, which is essential for maintaining low inference latency.

Aplicaciones reales del aprendizaje automático

Las arquitecturas sin servidor son especialmente eficaces para los flujos de trabajo de visión artificial (CV) y los procesos de datos basados en eventos.

  • Preprocesamiento automatizado de datos: cuando un usuario carga un conjunto de datos sin procesar en un servicio de almacenamiento como Amazon S3, puede activar una función sin servidor para realizar un preprocesamiento inmediato de los datos. La función puede cambiar el tamaño de las imágenes, normalizar los valores de píxeles o validar los formatos de archivo antes de que los datos entren en un canal de datos de entrenamiento, lo que garantiza la coherencia sin intervención manual.
  • Vigilancia inteligente bajo demanda: en AI in Security, un sensor de movimiento puede activar una cámara para capturar una imagen. Este evento invoca una función en la nube que aloja un modelo de detección de objetos. El modelo analiza la imagen para distinguir entre un animal inofensivo y un posible intruso, enviando una alerta solo cuando es necesario. Esto reduce drásticamente los costes de ancho de banda y almacenamiento en comparación con la transmisión continua.

Ejemplo Python : Gestor de inferencias sin servidor

El siguiente código muestra un controlador sin servidor conceptual. Inicializa una instancia de modelo global para aprovechar las «inicializaciones en caliente» (en las que el contenedor permanece activo entre solicitudes) y procesa una ruta de imagen entrante .

from ultralytics import YOLO

# Initialize the model outside the handler to cache it for subsequent requests
# YOLO26n is ideal for serverless due to its compact size and speed
model = YOLO("yolo26n.pt")


def lambda_handler(event, context):
    """Simulates a serverless function handler triggered by an event. 'event' represents the input payload containing
    the image source.
    """
    image_source = event.get("url", "https://ultralytics.com/images/bus.jpg")

    # Perform inference
    results = model(image_source)

    # Return prediction summary
    return {
        "statusCode": 200,
        "body": {
            "objects_detected": len(results[0].boxes),
            "top_class": results[0].names[int(results[0].boxes.cls[0])] if len(results[0].boxes) > 0 else "None",
        },
    }

Distinción de tecnologías afines

Para comprender la computación sin servidor es necesario diferenciarla de otros modelos de infraestructura que se utilizan a menudo en MLOps.

  • Computación sin servidor frente a computación periférica: aunque ambas tienen como objetivo optimizar la eficiencia, operan en ubicaciones diferentes. La computación periférica procesa los datos localmente en el dispositivo (por ejemplo, una cámara inteligente o un dispositivo IoT) para minimizar el tiempo de tránsito por la red. La computación sin servidor se produce en una nube pública centralizada. Las soluciones híbridas suelen procesar los datos iniciales en el perímetro y enviar las anomalías complejas a funciones de nube sin servidor para un análisis más profundo de las imágenes médicas o una revisión forense.
  • Sin servidor frente a Kubernetes: Kubernetes es una plataforma de orquestación para la contenedorización que ofrece a los desarrolladores un control granular sobre el entorno del clúster, las redes y los pods. Aunque es potente, requiere una importante sobrecarga de gestión. Las plataformas sin servidor, como Google Functions o Azure Functions, abstraen esta orquestación por completo, lo que permite a los equipos centrarse únicamente en la lógica del código en lugar de en el estado de los nodos.
  • Serverless vs. IaaS: Infrastructure-as-a-Service (IaaS) provides virtualized computing resources over the internet, like Amazon EC2. With IaaS, the user is responsible for patching the operating system and managing middleware. In contrast, serverless computing removes these operational responsibilities, allowing developers to focus on higher-level tasks like improving image classification accuracy.

By leveraging serverless architectures, developers can deploy robust AI solutions that are cost-effective and capable of handling unpredictable workloads, utilizing tools like the Ultralytics Platform to streamline the model training and management process before deployment.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora