ultralytics
Bringen Sie Ihre trainierten Modelle mit nur wenigen Klicks vom Browser-Test bis zu den Produktions-Endpunkten – mit automatischer Skalierung, Echtzeitüberwachung und über 17 Exportformaten.

43+
Einsatzregionen
17+
Exportformate
über 2,7 Mrd.
Alltägliche Verwendungszwecke





Spezielle Endpunkte werden bei Datenverkehrsspitzen hochgefahren und im Leerlauf auf null heruntergefahren.
Standardmäßig auf Null skalieren. Keine Kosten, wenn Ihr Endpunkt keine Anfragen erhält.
Keine Ratenbeschränkungen. Dedizierte Endpunkte unterliegen keinen Durchsatzbeschränkungen.
Konfigurierbare Ressourcen. Wählen Sie CPU 1–8 Kerne) und Arbeitsspeicher (1–32 GB) entsprechend Ihrer Arbeitslast.
Ultralytics unterstützt den Einsatz in der Cloud und am Netzwerkrand für hohe Leistung. AlleYOLO Ultralytics sind von Haus aus so optimiert, dass sie in allen Umgebungen effizient laufen, und bieten selbst auf Edge-Geräten mit begrenzten Rechenressourcen hohe Genauigkeit, zuverlässige Leistung und Kompatibilität.


Vollständige Echtzeit-Transparenz über die Leistung Ihrer Modelle. Sobald Ihre Modelle live sind, bietet Ihnen das Deployment-Dashboard einen zentralen Überblick über jeden laufenden Endpunkt – einschließlich der Metriken und Tools, die Sie benötigen, um Ihre Frameworks zu optimieren und einen zuverlässigen Betrieb sicherzustellen.
Anfragevolumen. Gesamtzahl der Anfragen über alle Endpunkte hinweg in den letzten 24 Stunden.
P95-Latenz. Reaktionszeit im 95. Perzentil zur track der Leistung track Anwendungsfällen.
Fehlerquoten. Erhalten Sie Benachrichtigungen, sobald die Fehlerquote 5 % übersteigt, und nutzen Sie nach Schweregrad gefilterte Protokolle, um Probleme schnell zu diagnostizieren.
Zustandsprüfungen. Live-Überwachung von Endpunkten mit automatischer Wiederholung. Anzeige der Latenz pro Prüfung.
Jeder bereitgestellte Endpunkt enthält automatisch generierte Code-Beispiele in Python, JavaScript und cURL, in denen Ihre tatsächliche Endpunkt-URL und Ihr API-Schlüssel bereits eingetragen sind. Kopieren Sie diese, fügen Sie sie ein und senden Sie Inferenzanfragen von jeder beliebigen Anwendung aus.

1
Mit Anmerkungen versehen
2
Zug
3
Bereitstellen
Ja. Jedes Modell kann gleichzeitig in mehreren Regionen bereitgestellt werden. Die Gesamtzahl der verfügbaren Endpunkte hängt von Ihrem Tarif ab: 3 bei der kostenlosen Version, 10 bei der Pro-Version und unbegrenzt bei der Enterprise-Version. So können Sie Nutzer weltweit mit Endpunkten mit geringer Latenz in jeder Region bedienen.
Dedizierte Endpunkte werden auf Basis von CPU, Arbeitsspeicher und Anforderungsvolumen abgerechnet. Da „Scale-to-Zero“ standardmäßig aktiviert ist, zahlen Sie nur für die aktive Inferenzzeit; es fallen keine Kosten an, wenn Ihr Endpunkt keine Anforderungen empfängt. Die gemeinsame Inferenz ist in Ihrem Plattform-Tarif enthalten.
Die gemeinsame Inferenz läuft auf einem mandantenfähigen Dienst in drei Regionen und ist auf 20 Anfragen pro Minute begrenzt. Sie eignet sich am besten für die Entwicklung und schnelle Tests. Dedizierte Endpunkte sind mandantenunabhängige Dienste, die in einer von 43 Regionen bereitgestellt werden und keine Ratenbegrenzung, eine konsistente Latenz sowie konfigurierbare Ressourcen bieten; sie sind für skalierbare Produktions-Workloads ausgelegt.
Die Bereitstellung eines dedizierten Endpunkts dauert in der Regel ein bis zwei Minuten. Dies umfasst die Bereitstellung des Containers, den Startvorgang sowie eine erste Funktionsprüfung, um sicherzustellen, dass der Dienst betriebsbereit ist. Sobald der Endpunkt bereit ist, nimmt er sofort Inferenzanfragen entgegen.
Die Modellbereitstellung ist der Prozess, bei dem ein trainiertes Computer-Vision-Modell bereitgestellt wird, um Daten aus der realen Welt zu empfangen und zu verarbeiten. Nach der Bereitstellung können Computer-Vision-Anwendungen über eine API Bilder und Videobilder an das Modell senden und Vorhersagen empfangen, was alles von der automatisierten Qualitätsprüfung bis hin zur Objekterkennung in Echtzeit in Produktionssystemen ermöglicht. Auf Ultralytics ist die Bereitstellung direkt in den durchgängigen Trainings-Workflow integriert. Sobald Ihr Modell trainiert ist, können Sie es im Browser testen, auf einem dedizierten Endpunkt in einer von 43 Regionen weltweit bereitstellen und seine Leistung überwachen – alles über denselben Arbeitsbereich.
Setzen Sie Ihre trainierten Modelle dank automatischer Skalierung und Echtzeitüberwachung in 43 Regionen weltweit ein.