Serverless Computing

Explore comment l'informatique sans serveur (serverless) simplifie le déploiement de l'IA. Apprends à construire des flux de travail évolutifs et rentables en utilisant Ultralytics YOLO26 pour une inférence ML efficace.

L'informatique sans serveur est un modèle d'exécution cloud qui permet aux développeurs de créer et d'exécuter des applications sans la complexité liée à la gestion de l'infrastructure. Dans ce paradigme, le fournisseur cloud gère dynamiquement l'allocation et le provisionnement des serveurs, en masquant le matériel sous-jacent et les systèmes d'exploitation à l'utilisateur. Le code est exécuté dans des conteneurs sans état, déclenchés par des événements spécifiques, tels qu'une requête HTTP, une modification de base de données ou un téléchargement de fichier. Cette approche est très pertinente pour les stratégies modernes de cloud computing, car elle permet aux organisations de ne payer que pour le temps de calcul consommé, en s'adaptant automatiquement aux exigences de scalability en passant de zéro à des milliers d'instances en fonction de la demande du trafic.

Link to this sectionLe fonctionnement du sans serveur pour l'IA#

Au cœur de l'informatique sans serveur se trouve le concept de Function-as-a-Service (FaaS), où les applications sont divisées en fonctions individuelles effectuant des tâches distinctes. Pour les praticiens du Machine Learning (ML), cela offre une voie rationalisée pour le model deployment. Au lieu de maintenir un serveur dédié qui reste inactif pendant les périodes de faible trafic, une fonction sans serveur peut démarrer à la demande pour traiter les données et s'arrêter immédiatement après.

Cependant, un point clé dans cette architecture est le « démarrage à froid » (cold start) : la latence induite lorsqu'une fonction est invoquée pour la première fois ou après une période d'inactivité. Pour atténuer cela, tu peux utiliser des architectures légères comme YOLO26 ou des techniques comme la model quantization afin de garantir des temps de chargement rapides, essentiels pour maintenir une faible inference latency.

Link to this sectionApplications concrètes dans le Machine Learning#

Les architectures sans serveur sont particulièrement efficaces pour les flux de travail et les pipelines de données axés sur la computer vision (CV).

Prétraitement automatisé des données : lorsqu'un utilisateur télécharge un jeu de données brut vers un service de stockage comme Amazon S3, cela peut déclencher une fonction sans serveur pour effectuer un data preprocessing immédiat. La fonction peut redimensionner des images, normaliser les valeurs de pixels ou valider les formats de fichier avant que les données n'entrent dans un pipeline de training data, garantissant ainsi la cohérence sans intervention manuelle.
Surveillance intelligente à la demande : dans AI in Security, un capteur de mouvement peut déclencher une caméra pour capturer une image. Cet événement invoque une fonction cloud hébergeant un modèle d'object detection. Le modèle analyse l'image pour distinguer un animal inoffensif d'un intrus potentiel, n'envoyant une alerte que lorsque cela est nécessaire. Cela réduit considérablement les coûts de bande passante et de stockage par rapport à un streaming continu.

Link to this sectionExemple en Python : gestionnaire d'inférence sans serveur#

Le code suivant montre un gestionnaire conceptuel sans serveur. Il initialise une instance de modèle globale pour tirer parti des « démarrages à chaud » (où le conteneur reste actif entre deux requêtes) et traite un chemin d'image entrant.

from ultralytics import YOLO

# Initialize the model outside the handler to cache it for subsequent requests
# YOLO26n is ideal for serverless due to its compact size and speed
model = YOLO("yolo26n.pt")


def lambda_handler(event, context):
    """Simulates a serverless function handler triggered by an event. 'event' represents the input payload containing
    the image source.
    """
    image_source = event.get("url", "https://ultralytics.com/images/bus.jpg")

    # Perform inference
    results = model(image_source)

    # Return prediction summary
    return {
        "statusCode": 200,
        "body": {
            "objects_detected": len(results[0].boxes),
            "top_class": results[0].names[int(results[0].boxes.cls[0])] if len(results[0].boxes) > 0 else "None",
        },
    }

Link to this sectionDistinguer les technologies associées#

Comprendre l'informatique sans serveur nécessite de la différencier d'autres modèles d'infrastructure souvent utilisés dans le MLOps.

Sans serveur vs Edge Computing : bien que les deux visent à optimiser l'efficacité, ils opèrent à des endroits différents. L'Edge computing traite les données localement sur l'appareil (par exemple, une caméra intelligente ou un IoT device) pour minimiser le temps de trajet réseau. L'informatique sans serveur se produit dans un cloud public centralisé. Les solutions hybrides traitent souvent les données initiales à la périphérie et envoient les anomalies complexes vers des fonctions cloud sans serveur pour une medical image analysis plus approfondie ou une révision médico-légale.
Sans serveur vs Kubernetes : Kubernetes est une plateforme d'orchestration pour la containerization qui donne aux développeurs un contrôle granulaire sur l'environnement de cluster, le réseau et les pods. Bien que puissant, cela nécessite une charge de gestion importante. Les plateformes sans serveur, telles que Google Cloud Functions ou Azure Functions, abstraient totalement cette orchestration, permettant aux équipes de se concentrer uniquement sur la logique du code plutôt que sur la santé des nœuds.
Sans serveur vs IaaS : l'Infrastructure-as-a-Service (IaaS) fournit des ressources informatiques virtualisées sur Internet, comme Amazon EC2. Avec l'IaaS, tu es responsable de la mise à jour du système d'exploitation et de la gestion des middleware. En revanche, l'informatique sans serveur supprime ces responsabilités opérationnelles, te permettant de te concentrer sur des tâches de plus haut niveau comme l'amélioration de la précision de l'image classification.

En tirant parti des architectures sans serveur, tu peux déployer des solutions d'IA robustes, rentables et capables de gérer des charges de travail imprévisibles, en utilisant des outils comme la Ultralytics Platform pour rationaliser le processus d'entraînement et de gestion des modèles avant le déploiement.

Explore solutions

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

Serverless Computing

Link to this sectionLe fonctionnement du sans serveur pour l'IA#

Link to this sectionApplications concrètes dans le Machine Learning#

Link to this sectionExemple en Python : gestionnaire d'inférence sans serveur#

Link to this sectionDistinguer les technologies associées#

Explore solutions

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

Construisons ensemble le futur de l'IA !