ultralytics
Bringen Sie Ihre trainierten Modelle mit nur wenigen Klicks vom Browser-Test bis zu den Produktions-Endpunkten – mit automatischer Skalierung, Echtzeitüberwachung und über 17 Exportformaten. Die End-to-End-Lösung für die Bereitstellung in realen Anwendungsfällen.

43+
Einsatzregionen
17+
Exportformate
500+
Aktive Einsätze





Spezielle Endpunkte werden bei Datenverkehrsspitzen automatisch hochskaliert und bei Inaktivität auf null heruntergefahren, sodass Sie niemals für Rechenleistung bezahlen, die Sie nicht nutzen.
Standardmäßig auf Null skalieren. Keine Kosten, wenn Ihr Endpunkt keine Anfragen erhält.
Keine Ratenbeschränkungen. Keine Ratenbeschränkungen. Im Gegensatz zur gemeinsam genutzten Inferenz unterliegen dedizierte Endpunkte keinen Durchsatzbeschränkungen und sind lediglich durch die Ressourcen Ihres Endpunkts begrenzt.
Konfigurierbare Ressourcen. Wählen Sie die Anzahl CPU (1–8) und den Arbeitsspeicher (1–32 GB) entsprechend den Anforderungen Ihres Modells und den Zugriffsmustern aus .
Ultralytics unterstützt sowohl den Einsatz in der Cloud als auch am Netzwerkrand. AlleYOLO Ultralytics sind von Haus aus so optimiert, dass sie in allen Umgebungen effizient laufen und selbst auf Hardware mit begrenzten Rechenressourcen eine zuverlässige Leistung bieten.


Vollständige Echtzeit-Transparenz über die Leistung Ihrer Modelle. Sobald Ihre Modelle live sind, bietet Ihnen das Deployment-Dashboard einen zentralen Überblick über jeden laufenden Endpunkt – einschließlich der Kennzahlen, die Sie benötigen, um einen zuverlässigen Betrieb Ihrer Frameworks sicherzustellen.
Anfragevolumen. Gesamtzahl der Anfragen über alle Endpunkte hinweg in den letzten 24 Stunden.
P95-Latenz. Reaktionszeit im 95. Perzentil zur track der Leistung track Anwendungsfällen.
Fehlerquoten. Hervorgehobene Warnmeldungen, wenn die Fehlerquote 5 % übersteigt, mit nach Schweregrad gefilterten Protokollen, die Ihnen helfen, Probleme schnell zu diagnostizieren.
Zustandsprüfungen. Live-Statusanzeigen mit automatischem Wiederholungsversuch, wenn Endpunkte nicht funktionsfähig sind. Die Antwortverzögerung wird neben jeder Prüfung angezeigt.
Jeder bereitgestellte Endpunkt enthält automatisch generierte Code-Beispiele in Python, JavaScript und cURL, in denen Ihre tatsächliche Endpunkt-URL und Ihr API-Schlüssel bereits eingetragen sind. Kopieren Sie diese, fügen Sie sie ein und senden Sie Inferenzanfragen von jeder beliebigen Anwendung aus.

Ja. Jedes Modell kann gleichzeitig in mehreren Regionen bereitgestellt werden. Die Gesamtzahl der verfügbaren Endpunkte hängt von Ihrem Tarif ab: 3 bei der kostenlosen Version, 10 bei der Pro-Version und unbegrenzt bei der Enterprise-Version. So können Sie Nutzer weltweit mit Endpunkten mit geringer Latenz in jeder Region bedienen.
Dedizierte Endpunkte werden auf Basis von CPU, Arbeitsspeicher und Anforderungsvolumen abgerechnet. Da „Scale-to-Zero“ standardmäßig aktiviert ist, zahlen Sie nur für die aktive Inferenzzeit; es fallen keine Kosten an, wenn Ihr Endpunkt keine Anforderungen empfängt. Die gemeinsame Inferenz ist in Ihrem Plattform-Tarif enthalten.
Die gemeinsame Inferenz läuft auf einem mandantenfähigen Dienst in drei Regionen und ist auf 20 Anfragen pro Minute begrenzt. Sie eignet sich am besten für die Entwicklung und schnelle Tests. Dedizierte Endpunkte sind mandantenunabhängige Dienste, die in einer von 43 Regionen bereitgestellt werden und keine Ratenbegrenzung, eine konsistente Latenz sowie konfigurierbare Ressourcen bieten; sie sind für skalierbare Produktions-Workloads ausgelegt.
Die Bereitstellung eines dedizierten Endpunkts dauert in der Regel ein bis zwei Minuten. Dies umfasst die Bereitstellung des Containers, den Startvorgang sowie eine erste Funktionsprüfung, um sicherzustellen, dass der Dienst betriebsbereit ist. Sobald der Endpunkt bereit ist, nimmt er sofort Inferenzanfragen entgegen.
Die Modellbereitstellung ist der Prozess, bei dem ein trainiertes Computer-Vision-Modell bereitgestellt wird, um Daten aus der realen Welt zu empfangen und zu verarbeiten. Nach der Bereitstellung können Computer-Vision-Anwendungen über eine API Bilder und Videobilder an das Modell senden und Vorhersagen empfangen, was alles von der automatisierten Qualitätsprüfung bis hin zur Objekterkennung in Echtzeit in Produktionssystemen ermöglicht. Auf Ultralytics ist die Bereitstellung direkt in den durchgängigen Trainings-Workflow integriert. Sobald Ihr Modell trainiert ist, können Sie es im Browser testen, auf einem dedizierten Endpunkt in einer von 43 Regionen weltweit bereitstellen und seine Leistung überwachen – alles über denselben Arbeitsbereich.
Setzen Sie Ihre trainierten Modelle dank automatischer Skalierung und Echtzeitüberwachung in 43 Regionen weltweit ein.