Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten

ultralytics

Vision-KI-Modelle in 43 Regionen weltweit bereitstellen

Bringen Sie Ihre trainierten Modelle mit nur wenigen Klicks vom Browser-Test bis zu den Produktions-Endpunkten – mit automatischer Skalierung, Echtzeitüberwachung und über 17 Exportformaten. Die End-to-End-Lösung für die Bereitstellung in realen Anwendungsfällen.

Benutzeroberfläche mit Exportoptionen für PyTorch , darunter ONNX, TorchScript, OpenVINO, TensorRT, CoreML, TF , TF SavedModel und TF GraphDef, sowie einer Weltkarte, auf der drei Bereitstellungen grün und mehrere Standorte rot markiert sind.

43+

Einsatzregionen

17+

Exportformate

500+

Aktive Einsätze

In 43 Regionen weltweit bereitstellen

Stellen Sie Ihre Modelle auf dedizierten Endpunkten in 43 Regionen weltweit bereit, darunter Nord- und Südamerika, Europa, der asiatisch-pazifische Raum und der Nahe Osten. Jeder Endpunkt ist ein Single-Tenant-Dienst mit eigener URL, automatischer Skalierung und unabhängiger Überwachung.
Weltkarte mit verschiedenen Orten, die in Nordamerika, Europa und Asien mit farbigen Stecknadeln markiert sind.
Dashboard mit Leistungsmetriken des Modells: mAP50 96,2 %, mAP50 bei 90,1 % und Präzision bei 87,2 %, ergänzt durch einen Protokollbereich für das in Paris eingesetzte Segmentierungsmodell YOLO26s.

Automatische Skalierung, die sich Ihrem Datenverkehr anpasst

Spezielle Endpunkte werden bei Datenverkehrsspitzen automatisch hochskaliert und bei Inaktivität auf null heruntergefahren, sodass Sie niemals für Rechenleistung bezahlen, die Sie nicht nutzen.

Standardmäßig auf Null skalieren. Keine Kosten, wenn Ihr Endpunkt keine Anfragen erhält.

Keine Ratenbeschränkungen. Keine Ratenbeschränkungen. Im Gegensatz zur gemeinsam genutzten Inferenz unterliegen dedizierte Endpunkte keinen Durchsatzbeschränkungen und sind lediglich durch die Ressourcen Ihres Endpunkts begrenzt.

Konfigurierbare Ressourcen. Wählen Sie die Anzahl CPU (1–8) und den Arbeitsspeicher (1–32 GB) entsprechend den Anforderungen Ihres Modells und den Zugriffsmustern aus .

Über 17 Exportformate. Ihr Modell. Jede Umgebung.

Ultralytics unterstützt sowohl den Einsatz in der Cloud als auch am Netzwerkrand. AlleYOLO Ultralytics sind von Haus aus so optimiert, dass sie in allen Umgebungen effizient laufen und selbst auf Hardware mit begrenzten Rechenressourcen eine zuverlässige Leistung bieten.

Liste der Exportformate für PyTorch , darunter ONNX, TorchScript, OpenVINO, TensorRT GPU, CoreML und TF , mit den jeweiligen Symbolen und Formatcodes.
Das Dashboard zeigt insgesamt 13.959 Anfragen, 3 aktive Bereitstellungen, eine Fehlerquote von 0 % und eine P95-Latenz von 14 ms in den letzten 24 Stunden an.

Überwachen Sie alles in der Produktion

Vollständige Echtzeit-Transparenz über die Leistung Ihrer Modelle. Sobald Ihre Modelle live sind, bietet Ihnen das Deployment-Dashboard einen zentralen Überblick über jeden laufenden Endpunkt – einschließlich der Kennzahlen, die Sie benötigen, um einen zuverlässigen Betrieb Ihrer Frameworks sicherzustellen.

Anfragevolumen. Gesamtzahl der Anfragen über alle Endpunkte hinweg in den letzten 24 Stunden.

P95-Latenz. Reaktionszeit im 95. Perzentil zur track der Leistung track Anwendungsfällen.

Fehlerquoten. Hervorgehobene Warnmeldungen, wenn die Fehlerquote 5 % übersteigt, mit nach Schweregrad gefilterten Protokollen, die Ihnen helfen, Probleme schnell zu diagnostizieren.

Zustandsprüfungen. Live-Statusanzeigen mit automatischem Wiederholungsversuch, wenn Endpunkte nicht funktionsfähig sind. Die Antwortverzögerung wird neben jeder Prüfung angezeigt.

In wenigen Minuten integrieren

Jeder bereitgestellte Endpunkt enthält automatisch generierte Code-Beispiele in Python, JavaScript und cURL, in denen Ihre tatsächliche Endpunkt-URL und Ihr API-Schlüssel bereits eingetragen sind. Kopieren Sie diese, fügen Sie sie ein und senden Sie Inferenzanfragen von jeder beliebigen Anwendung aus.

Python zum Senden eines Bildes an einen Deployment-Endpunkt mithilfe von „requests“ mit Autorisierungs- und Inferenzparametern.

Müssen Sie zuerst ein Modell trainieren?

Ultralytics vereint Annotation, Training und Bereitstellung auf einer einzigen Plattform.

Häufig gestellte Fragen

Kann ich dasselbe Modell in mehreren Regionen bereitstellen?

Ja. Jedes Modell kann gleichzeitig in mehreren Regionen bereitgestellt werden. Die Gesamtzahl der verfügbaren Endpunkte hängt von Ihrem Tarif ab: 3 bei der kostenlosen Version, 10 bei der Pro-Version und unbegrenzt bei der Enterprise-Version. So können Sie Nutzer weltweit mit Endpunkten mit geringer Latenz in jeder Region bedienen.

Wie viel kostet die Bereitstellung?

Dedizierte Endpunkte werden auf Basis von CPU, Arbeitsspeicher und Anforderungsvolumen abgerechnet. Da „Scale-to-Zero“ standardmäßig aktiviert ist, zahlen Sie nur für die aktive Inferenzzeit; es fallen keine Kosten an, wenn Ihr Endpunkt keine Anforderungen empfängt. Die gemeinsame Inferenz ist in Ihrem Plattform-Tarif enthalten.

Was ist der Unterschied zwischen gemeinsamer und dedizierter Inferenz?

Die gemeinsame Inferenz läuft auf einem mandantenfähigen Dienst in drei Regionen und ist auf 20 Anfragen pro Minute begrenzt. Sie eignet sich am besten für die Entwicklung und schnelle Tests. Dedizierte Endpunkte sind mandantenunabhängige Dienste, die in einer von 43 Regionen bereitgestellt werden und keine Ratenbegrenzung, eine konsistente Latenz sowie konfigurierbare Ressourcen bieten; sie sind für skalierbare Produktions-Workloads ausgelegt.

Wie lange dauert die Bereitstellung?

Die Bereitstellung eines dedizierten Endpunkts dauert in der Regel ein bis zwei Minuten. Dies umfasst die Bereitstellung des Containers, den Startvorgang sowie eine erste Funktionsprüfung, um sicherzustellen, dass der Dienst betriebsbereit ist. Sobald der Endpunkt bereit ist, nimmt er sofort Inferenzanfragen entgegen.

Was ist Model Deployment?

Die Modellbereitstellung ist der Prozess, bei dem ein trainiertes Computer-Vision-Modell bereitgestellt wird, um Daten aus der realen Welt zu empfangen und zu verarbeiten. Nach der Bereitstellung können Computer-Vision-Anwendungen über eine API Bilder und Videobilder an das Modell senden und Vorhersagen empfangen, was alles von der automatisierten Qualitätsprüfung bis hin zur Objekterkennung in Echtzeit in Produktionssystemen ermöglicht. Auf Ultralytics ist die Bereitstellung direkt in den durchgängigen Trainings-Workflow integriert. Sobald Ihr Modell trainiert ist, können Sie es im Browser testen, auf einem dedizierten Endpunkt in einer von 43 Regionen weltweit bereitstellen und seine Leistung überwachen – alles über denselben Arbeitsbereich.

Beginnen Sie noch heute mit der Bereitstellung

Setzen Sie Ihre trainierten Modelle dank automatischer Skalierung und Echtzeitüberwachung in 43 Regionen weltweit ein.