Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Vision AI

Инференс в реальном времени в решениях Vision AI приносит результаты

Узнай, почему инференс в реальном времени важен для компьютерного зрения в ряде приложений и какова его роль в принятии мгновенных решений.

АБАбирами Вина
4 min read
Инференс в реальном времени в решениях Vision AI

Каждый из нас сталкивался с тем, как раздражает медленное интернет-соединение. А теперь представь такую задержку в критической ситуации: например, когда беспилотный автомобиль должен среагировать на препятствие или врач анализирует важный снимок. Пара лишних секунд может привести к серьезным последствиям.

Именно здесь инференс AI в реальном времени имеет решающее значение. Быстрая обработка и прогнозы в реальном времени позволяют решениям computer vision мгновенно обрабатывать визуальные данные и реагировать на них. Такие решения, принимаемые за доли секунды, повышают безопасность, эффективность и повседневный комфорт.

Возьмем, к примеру, хирурга, проводящего сложную операцию с помощью робота-ассистента. Каждое движение контролируется через высокоскоростное соединение, а система зрения робота анализирует операционное поле в реальном времени, предоставляя хирургу мгновенную визуальную обратную связь. Даже малейшая задержка в этом контуре обратной связи может привести к серьезным ошибкам, подвергая пациента опасности. Это отличный пример того, почему инференс в реальном времени крайне важен: здесь нет места задержкам.

Инференс AI в реальных приложениях зависит от трех ключевых концепций: инференс-движков (программное или аппаратное обеспечение, которое эффективно запускает модели AI), задержки инференса (время между вводом и выводом) и инференса в реальном времени (способность системы AI обрабатывать данные и реагировать с минимальной задержкой).

В этой статье мы рассмотрим основные концепции и то, как модели компьютерного зрения, такие как Ultralytics YOLO11, обеспечивают работу приложений, требующих мгновенных прогнозов.

Link to this sectionЧто такое инференс AI?#

Запуск инференса — это процесс анализа новых данных с помощью обученной модели AI для получения прогноза или решения задачи. В отличие от обучения, которое включает обучение модели путем обработки огромных объемов размеченных данных, инференс фокусируется на быстром и точном получении результатов с использованием уже обученной модели.

Понимание того, что такое инференс

Рис 1. Понимание того, что такое инференс.

Например, в защите дикой природы AI camera-ловушки используют модели компьютерного зрения для идентификации и классификации животных в реальном времени. Когда камера обнаруживает движение, модель AI мгновенно распознает, олень это, хищник или даже браконьер, помогая исследователям отслеживать популяции животных и защищать исчезающие виды без участия человека. Эта быстрая идентификация делает мониторинг в реальном времени и оперативное реагирование на потенциальные угрозы вполне реальными.

Link to this sectionПонимание инференс-движков#

Обученная модель машинного обучения не всегда готова к развертыванию в исходном виде. Inference engine — это специализированный программный или аппаратный инструмент, предназначенный для эффективного выполнения моделей машинного обучения и их оптимизации для реального развертывания. Он использует optimization techniques, такие как сжатие модели, квантование и преобразование графа, чтобы улучшить производительность и снизить потребление ресурсов, делая модель готовой к работе в различных средах.

По своей сути, инференс-движок фокусируется на снижении вычислительных затрат, минимизации задержек и повышении эффективности для обеспечения быстрых и точных прогнозов. После оптимизации движок выполняет модель на новых данных, позволяя эффективно генерировать инференс в реальном времени. Эта оптимизация гарантирует, что модели AI могут бесперебойно работать как на высокопроизводительных облачных серверах, так и на ресурсоограниченных edge-устройствах, таких как смартфоны, устройства IoT и встраиваемые системы.

Link to this sectionПроблемы, вызванные задержкой инференса#

Inference latency — это временная задержка между моментом получения системой AI входных данных (например, изображения с камеры) и моментом выдачи результата (например, обнаружение объектов на изображении). Даже небольшая задержка может существенно повлиять на производительность и удобство использования приложений AI в реальном времени.

Задержка инференса возникает на трех ключевых этапах:

  • Время предобработки: Время, необходимое для подготовки входных данных перед подачей в модель. Сюда входит изменение размера изображений в соответствии с входными параметрами модели, нормализация значений пикселей для повышения точности и конвертация форматов (например, RGB в градации серого или видео в последовательность кадров).
  • Время вычислений: Фактическое время, которое требуется модели для выполнения инференса. Это включает такие операции, как послойные вычисления в глубоких сетях, матричное умножение, свертки и передачу данных между памятью и вычислительными блоками.
  • Время пост-обработки: Время, необходимое для преобразования необработанных выходных данных модели в понятные результаты. Это может включать отрисовку BBox при обнаружении объектов, фильтрацию ложных срабатываний при распознавании изображений или применение пороговых значений при обнаружении аномалий.

Задержка инференса критична в приложениях реального времени. Например, при автоматическом обнаружении дефектов на сборочной линии компьютерное зрение может использоваться для проверки продукции по мере ее движения по конвейеру.

Система должна быстро идентифицировать и отмечать дефекты, прежде чем продукты перейдут на следующий этап. Если модель обрабатывает изображения слишком долго, дефектные товары могут не быть обнаружены вовремя, что приведет к отходам материалов, дорогостоящей переделке или попаданию бракованной продукции к клиентам. Сокращая задержку, производители могут улучшить контроль качества, повысить эффективность и сократить потери.

Link to this sectionКак уменьшить задержку инференса#

Минимизация задержки инференса необходима во многих приложениях компьютерного зрения. Для этого можно использовать различные методы. Давай обсудим некоторые из наиболее распространенных способов сокращения задержки инференса.

Link to this sectionПрунинг (прореживание) модели#

Model pruning упрощает нейронную сеть путем удаления ненужных соединений (весов), делая ее меньше и быстрее. Этот процесс снижает вычислительную нагрузку на модель, повышая скорость без существенного ущерба для точности.

Сохраняя только самые важные связи, прунинг обеспечивает эффективный инференс и лучшую производительность, особенно на устройствах с ограниченной вычислительной мощностью. Он широко используется в приложениях реального времени, таких как мобильный AI, робототехника и edge computing, для повышения эффективности при сохранении надежности.

Устранение менее эффективных связей с помощью прунинга моделей

Рис 2. Устранение менее эффективных соединений с помощью прунинга модели.

Link to this sectionКвантование модели#

Model quantization — это метод, который заставляет модели AI работать быстрее и потреблять меньше памяти за счет упрощения чисел, используемых для расчетов. Обычно эти модели работают с 32-битными числами с плавающей запятой, которые очень точны, но требуют больших вычислительных мощностей. Квантование преобразует эти числа в 8-битные целые числа, которые проще обрабатывать и которые занимают меньше места.

Использование квантования моделей для преобразования значений с плавающей запятой в целые числа

Рис 3. Использование квантования модели для преобразования значений с плавающей запятой в целочисленное представление.

Link to this sectionИспользование эффективных моделей#

Архитектура модели AI оказывает огромное влияние на скорость формирования прогнозов. Модели, такие как YOLO11, созданные для эффективного инференса, идеально подходят для приложений, где скорость обработки критична.

Когда ты создаешь решение на базе AI, важно выбрать правильную модель в зависимости от имеющихся ресурсов и потребностей в производительности. Если ты начнешь с «тяжелой» модели, то, скорее всего, столкнешься с такими проблемами, как медленная обработка, высокое энергопотребление и трудности с развертыванием на ресурсоограниченных устройствах. Легковесная модель обеспечивает плавную работу, особенно в приложениях реального времени и edge-устройствах.

Link to this sectionСкорость против точности: оптимизация инференса в реальном времени#

Хотя существует множество методов снижения задержки, ключевой частью real-time inferences является поиск баланса между скоростью и точностью. Сделать модели быстрее недостаточно — скорость инференса должна быть оптимизирована без ущерба для точности. Система, которая выдает быстрые, но неверные прогнозы, неэффективна. Именно поэтому тщательное тестирование жизненно важно для того, чтобы убедиться, что модели хорошо работают в реальных условиях. Система, которая кажется быстрой при тестировании, но дает сбои в реальных сценариях, не является по-настоящему оптимизированной.

Link to this sectionПриложения Vision AI, использующие инференс в реальном времени#

Далее давай разберем несколько реальных приложений, где инференс в реальном времени трансформирует отрасли, обеспечивая мгновенный отклик на визуальные данные.

Link to this sectionСистемы касс самообслуживания в розничных магазинах#

Модели компьютерного зрения, такие как YOLO11, могут помочь улучшить системы касс самообслуживания, делая распознавание товаров быстрее и точнее. Поддержка в YOLO11 различных computer vision tasks, таких как обнаружение объектов и сегментация экземпляров, позволяет идентифицировать товары, даже если штрих-коды отсутствуют или повреждены. Vision AI может снизить потребность в ручном вводе и ускорить процесс оплаты.

Помимо идентификации продуктов, компьютерное зрение может быть интегрировано в кассы самообслуживания для проверки цен, предотвращения мошенничества и повышения удобства клиентов. Камеры с поддержкой AI могут автоматически различать похожие товары и обнаруживать подозрительное поведение на кассе. Это включает выявление «пропусков сканирования», когда покупатель или кассир случайно пропускает товар, и более преднамеренных попыток мошенничества, таких как «подмена продукта», когда более дешевый штрих-код наклеивается на более дорогой товар.

ИИ для улучшения касс самообслуживания

Рис 4. AI может улучшить кассы самообслуживания.

Отличным примером этого является Kroger, крупный американский ритейлер, который интегрировал компьютерное зрение и AI в свои системы касс самообслуживания. Используя видеоанализ в реальном времени, Kroger смог автоматически исправлять более 75% ошибок на кассах, улучшая как опыт клиентов, так и операционную деятельность магазина.

Link to this sectionКонтроль качества с помощью компьютерного зрения#

Ручной inspecting products для контроля качества может быть медленным и не всегда точным. Вот почему все больше производителей переходят на рабочие процессы визуального контроля, использующие компьютерное зрение для выявления дефектов на ранних стадиях производственного процесса.

Камеры высокого разрешения и Vision AI могут заметить крошечные недостатки, которые могут пропустить люди, а модели, такие как YOLO11, могут помочь с проверкой качества, сортировкой и подсчетом в реальном времени, чтобы гарантировать, что только идеальные продукты попадут к клиентам. Автоматизация этого процесса экономит время, сокращает расходы и уменьшает количество отходов, делая производство более отлаженным и эффективным.

Использование YOLO11 для подсчета продуктов на сборочной линии

Рис 5. Пример использования YOLO11 для подсчета продукции на сборочной линии.

Link to this sectionОсновные выводы#

Инференс в реальном времени помогает моделям AI принимать мгновенные решения, что критически важно во многих отраслях. Будь то беспилотный автомобиль, избегающий аварии, врач, быстро анализирующий медицинские снимки, или завод, обнаруживающий дефекты продукции, быстрые и точные ответы AI имеют огромное значение.

Повышая скорость и эффективность моделей AI, мы можем создавать более умные и надежные системы, которые бесперебойно работают в реальных условиях. По мере развития технологий решения AI в реальном времени будут продолжать формировать будущее, делая повседневные процессы быстрее, безопаснее и эффективнее.

Чтобы узнать больше, посети наш GitHub repository и присоединяйся к нашему сообществу. Исследуй инновации в таких секторах, как AI in self-driving cars и computer vision in agriculture, на страницах наших решений. Ознакомься с нашими вариантами лицензирования и воплощай свои проекты Vision AI в жизнь.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения