Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

Calcolo Serverless

Scopri come il serverless computing rivoluziona l'IA/ML con scalabilità, efficienza dei costi e implementazione rapida. Costruisci in modo più intelligente e veloce oggi stesso!

Il serverless computing è un modello di esecuzione del cloud in cui il cloud provider gestisce dinamicamente l'allocazione e il provisioning dei server, consentendo agli sviluppatori di creare ed eseguire applicazioni senza gestire i server sottostanti. server, consentendo agli sviluppatori di creare ed eseguire applicazioni senza gestire l'infrastruttura sottostante. infrastruttura sottostante. In questa architettura, il codice viene eseguito in contenitori stateless che vengono attivati da eventi specifici, automaticamente da zero a migliaia di richieste in modo istantaneo. Questo modello pay-per-use è altamente efficiente per i carichi di lavoro carichi di lavoro con traffico variabile, rendendolo una pietra miliare dello sviluppo di applicazioni di sviluppo di applicazioni di Machine Learning (ML) e delle strategie di cloud computing.

La meccanica di Serverless

Il cuore dell'informatica serverless è il paradigma paradigma Function-as-a-Service (FaaS). Invece di distribuire un'applicazione applicazione monolitica, la logica viene suddivisa in singole funzioni che eseguono singoli compiti. Queste funzioni sono sono event-driven, ovvero vengono eseguite solo quando vengono attivate da un'azione, come ad esempio una richiesta HTTP attraverso un Gateway API, il caricamento di un file su servizi di archiviazione come Amazon S3 o l'aggiornamento di un database.

Il cloud provider gestisce tutti i costi operativi, tra cui la manutenzione del sistema operativo, il provisioning della capacità e la scalabilità. capacità e scalabilità. Questa astrazione consente ai di concentrarsi interamente sulla scrittura di codice per di computer vision o di analisi dei dati, accelerando accelerando in modo significativo il ciclo di vita dello sviluppo definito dalle MLOps.

Serverless in AI e apprendimento automatico

Le architetture serverless sono particolarmente vantaggiose per l'implementazione di modelli di intelligenza artificiale grazie alla loro capacità di gestire di gestire schemi di traffico "a raffica" senza incorrere nei costi dei server inattivi.

  • Inferenza su richiesta: Ospitare un modello per in tempo reale su un server dedicato può essere essere costoso se le richieste sono sporadiche. Le funzioni serverless possono caricare un modello come YOLO11 solo quando l'utente fa una richiesta, elaborando l'immagine e restituendo previsioni in modo immagine e restituire le previsioni in modo economicamente vantaggioso.
  • Pipeline di pre-elaborazione dei dati: Le funzioni serverless sono ideali per attività di pre-elaborazione dei dati. Ad esempio, caricare un set di dati grezzi può attivare funzioni per ridimensionare le immagini, normalizzare i valori dei pixel o convertire i formati dei file, per prepararli all'addestramento del modello.
  • Riqualificazione del modello: In un flusso di lavoro guidato dagli eventi, cali significativi nelle prestazioni del modello prestazioni del modello rilevate dagli strumenti di monitoraggio possono innescare automaticamente una pipeline di riqualificazione utilizzando dati nuovi.

Esempio Python : Gestore dell'inferenza senza server

Il codice seguente illustra una funzione concettuale di handler che carica un modello Ultralytics leggero per eseguire il di oggetti su un percorso di immagini fornito da un evento.

from ultralytics import YOLO

# Initialize the model outside the handler to cache it for warm starts
# YOLO11n is chosen for its small size and speed, ideal for serverless environments
model = YOLO("yolo11n.pt")


def lambda_handler(event, context):
    """Simulated serverless handler for performing inference. 'event' contains the input data, e.g., path to an image.
    """
    image_path = event.get("image_path", "data/images/bus.jpg")

    # Run inference
    results = model(image_path)

    # Return the count of detected objects
    return {"status": "success", "objects_detected": len(results[0].boxes)}

Applicazioni nel mondo reale

  1. Sistemi di sicurezza intelligenti: Le telecamere di sicurezza domestica possono utilizzare Edge AI per detect movimento e caricare un'istantanea sul cloud. cloud. Questo evento di caricamento attiva una funzione serverless (ad esempio, su AWS Lambda o Google Cloud Functions) che esegue un modello di rilevamento più accurato per identificare per identificare se il movimento è stato causato da una persona o da un animale domestico, riducendo i falsi allarmi.
  2. Analisi agricola: In AI in agricoltura, i droni che catturano le immagini dei campi immagini sul campo possono caricare i dati in un bucket centrale. In questo modo si attivano funzioni serverless parallele per analizzare lo stato di salute dei raccolti su migliaia di immagini simultaneamente, sfruttando il parallelismo massivo del cloud per completare il lavoro in minuti anziché in ore.

Distinguere i concetti correlati

Per capire dove si colloca serverless è necessario distinguerlo da tecnologie simili:

  • Serverless vs. Containerizzazione: Mentre serverless utilizza spesso i container sotto il cofano, tecnologie di containerizzazione come Docker e le piattaforme di orchestrazione come Kubernetes richiedono che l'utente gestisca il ciclo di vita dei container e le risorse del cluster. e le risorse del cluster. Serverless astrae completamente questo aspetto.
  • Serverless vs. Edge Computing: L'edge computing elabora i dati localmente sul dispositivo (ad esempio, un sistema incorporato o un sensore IoT) per ridurre al minimo la latenza. Serverless avviene in un ambiente cloud centralizzato. centralizzato. Gli approcci ibridi utilizzano spesso dispositivi edge per il filtraggio immediato e serverless per l'analisi di deep learning. analisi di deep learning.
  • Serverless vs. PaaS: La piattaforma come servizio (PaaS) fornisce un framework per la creazione di app, ma spesso comporta una maggiore configurazione del numero di istanze o di ambienti di runtime rispetto alla natura puramente event-driven di serverless. ambienti di runtime rispetto alla natura puramente event-driven di serverless.

Adottando il serverless computing, le organizzazioni possono implementare applicazioni di computer vision robuste e robuste applicazioni di computer vision che sono economiche e in grado di raggiungere una scala globale, allineando la spesa per l'infrastruttura direttamente al valore aziendale.

Unitevi alla comunità di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora