Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024
Глоссарий

Задержка инференса

Оптимизируйте производительность ИИ с низкой задержкой inference. Изучите ключевые факторы, реальные приложения и методы повышения скорости реагирования в реальном времени.

Задержка логического вывода — это время, которое требуется обученной модели машинного обучения (ML) для получения входных данных и возврата соответствующего выходного сигнала или прогноза. Измеряемая в миллисекундах (мс), она является важнейшей метрикой производительности в области искусственного интеллекта (AI), особенно для приложений, требующих немедленной обратной связи. Низкая задержка необходима для создания адаптивных и эффективных AI-систем, которые могут работать в динамичных, реальных условиях.

Почему важна задержка при выводе

Низкая задержка инференса является ключом к обеспечению инференса в реальном времени, где прогнозы должны быть предоставлены в строгие сроки, чтобы быть полезными. Во многих сценариях задержка даже в несколько миллисекунд может сделать приложение неэффективным или небезопасным. Например, беспилотный автомобиль должен мгновенно идентифицировать пешеходов и препятствия, чтобы избежать столкновений, в то время как интерактивному ИИ-помощнику необходимо быстро реагировать на запросы пользователей, чтобы поддерживать естественный ход разговора. Достижение низкой задержки является центральной задачей в развертывании моделей, непосредственно влияющей на пользовательский опыт и осуществимость приложения.

Применение в реальном мире

Задержка логического вывода является решающим фактором успеха многих приложений компьютерного зрения. Вот два примера:

  1. Автономное вождение: В автомобильной промышленности система обнаружения объектов автономного транспортного средства должна обрабатывать данные с камер и датчиков с минимальной задержкой. Низкая задержка позволяет транспортному средству вовремя обнаружить пешехода, выходящего на дорогу, и применить тормоза, что является критически важной функцией безопасности, где важна каждая миллисекунда.
  2. Медицинская диагностика: В здравоохранении модели ИИ анализируют медицинские изображения для выявления заболеваний. Когда такая модель, как Ultralytics YOLO11, используется для обнаружения опухолей в медицинской визуализации, низкая задержка инференса позволяет рентгенологам получать аналитические результаты практически мгновенно. Этот быстрый цикл обратной связи ускоряет процесс диагностики, что приводит к более быстрому принятию решений о лечении пациентов.

Факторы, влияющие на задержку при выводе

На скорость выполнения инференса моделью влияет несколько факторов:

Задержка логического вывода и пропускная способность

Несмотря на то, что задержка и пропускная способность при выводе часто обсуждаются вместе, они измеряют разные аспекты производительности.

  • Задержка логического вывода измеряет скорость одного прогноза (например, как быстро обрабатывается одно изображение). Это основная метрика для приложений, требующих немедленных ответов.
  • Пропускная способность измеряет общее количество выводов, выполненных за период времени (например, кадров в секунду). Это более актуально для систем пакетной обработки, где основной задачей является общая производительность.

Оптимизация для одного может негативно повлиять на другое. Например, увеличение размера пакета, как правило, повышает пропускную способность, но увеличивает время получения результата для каждого отдельного ввода в этом пакете, тем самым ухудшая задержку. Понимание этого компромисса между задержкой и пропускной способностью имеет основополагающее значение для проектирования систем ИИ, отвечающих конкретным эксплуатационным требованиям.

Управление задержкой при выводе (inference latency) — это баланс между точностью модели, вычислительными затратами и временем отклика. Конечная цель состоит в том, чтобы выбрать модель и стратегию развертывания, которые соответствуют потребностям приложения в производительности, и этот процесс можно контролировать с помощью таких платформ, как Ultralytics HUB.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас
Ссылка скопирована в буфер обмена