Узнайте, как выводы в реальном времени с помощью Ultralytics YOLO позволяют мгновенно прогнозировать для таких приложений ИИ, как автономное вождение и системы безопасности.
Вывод в реальном времени - это процесс, в котором обученная модель машинного обучения принимает входные данные в реальном времени и генерирует прогноз практически мгновенно. В данном контексте "реальное время" подразумевает, что скорость обработки скорость обработки достаточна для того, чтобы успевать за потоком входящих данных, что позволяет системе мгновенно принимать решения. Эта возможность является краеугольным камнем современных компьютерного зрения, позволяя устройствам воспринимать и реагировать на окружающую среду с минимальной задержкой.
Основной метрикой для оценки производительности в реальном времени является задержка вывода, которая измеряет время прошедшее между получением моделью входных данных и выдачей выходных. Для того чтобы система считалась системой реального времени, эта чтобы система считалась работающей в реальном времени, эта задержка должна быть достаточно низкой, чтобы удовлетворять конкретным временным ограничениям конкретного случая использования. Например. система понимания видео, анализирующая поток с частотой 30 кадров в секунду (FPS), имеет примерно 33 миллисекунды на обработку каждого кадра. Если вывод занимает больше времени, кадры отбрасываются, и система отстает.
Для достижения такой скорости часто используется специализированное оборудование, например графических процессоров или специализированных ускорители Edge AI, такие как платформаNVIDIA Jetson. Кроме того, инженеры часто используют методы оптимизации моделей чтобы снизить сложность вычислений без существенного снижения точности.
Важно отличать рабочие процессы в реальном времени от пакетного анализа. В то время как при выводе в реальном времени точки данных обрабатываются по отдельности по мере их поступления, чтобы минимизировать задержку, пакетный вывод группирует данные в большие фрагменты для последующей обработки.
Способность генерировать мгновенные прогнозы изменила несколько отраслей промышленности, автоматизировав сложные задачи, требующие принятия решений в доли секунды. требующих принятия решений в доли секунды.
Чтобы добиться необходимой скорости работы приложений в реальном времени, разработчики часто развертывают модели с использованием оптимизированных механизмов вывода движки. Такие фреймворки, как TensorRT для NVIDIA оборудование или OpenVINO для процессоров Intel могут значительно ускорить производительность. Кроме того, такие техники, как квантование модели, котороеснижает точность весовых коэффициентов модели с плавающей точки до целочисленных значений, может значительно сократить занимаемую память и повысить скорость выполнения на встраиваемых системах.
Следующий пример на Python демонстрирует, как запустить вывод в реальном времени на основе данных с веб-камеры, используя
ultralytics библиотека.
from ultralytics import YOLO
# Load the official YOLO11 nano model, optimized for speed
model = YOLO("yolo11n.pt")
# Run inference on the default webcam (source=0)
# 'stream=True' creates a generator for memory-efficient real-time processing
# 'show=True' displays the video feed with prediction overlays
results = model.predict(source="0", stream=True, show=True)
# Process the generator to keep the stream running
for result in results:
pass
По мере расширения возможностей связи 5G и увеличения мощности оборудования, расширяется сфера применения ИИ в реальном времени. Такие понятия, как Интернет вещей (IoT) становятся все более интеллектуальными, превращаясь из простого сборщика данных в активное лицо, принимающее решения. Будущие разработки, такие как такие как готовящийся к выпуску YOLO26, призваны еще больше расширить эти границы предлагая нативные сквозные модели, которые будут еще меньше и быстрее, гарантируя, что умные города и медицинские устройства смогут умные города и медицинские устройства смогут бесперебойно работать в режиме реального времени.