Умозаключения в реальном времени в решениях Vision AI оказывают влияние

Абирами Вина

4 мин. чтения

20 февраля 2025 г.

Узнайте, почему умозаключения в реальном времени в компьютерном зрении важны для целого ряда приложений, и изучите их роль в обеспечении мгновенного принятия решений.

Каждый из нас хоть раз сталкивался с проблемой медленного интернет-соединения. Однако представьте себе эту задержку в ситуации, требующей больших затрат, например, когда самоуправляемый автомобиль реагирует на препятствие или врач анализирует критический снимок. Несколько лишних секунд могут иметь серьезные последствия. 

Именно здесь ИИ в реальном времени может сыграть решающую роль. Быстрая обработка и прогнозирование в реальном времени позволяют решениям для компьютерного зрения мгновенно обрабатывать визуальные данные и реагировать на них. Такие решения в доли секунды повышают безопасность, эффективность и повседневное удобство. 

Например, хирург выполняет тонкую операцию с помощью робота-ассистента. Каждое движение контролируется через высокоскоростное соединение, а система технического зрения робота обрабатывает операционное поле в режиме реального времени, обеспечивая хирургу мгновенную визуальную обратную связь. Даже малейшая задержка в этом цикле обратной связи может привести к серьезным ошибкам и подвергнуть пациента риску. Это прекрасный пример того, почему умозаключения в реальном времени имеют решающее значение; здесь нет места задержкам. 

Выводы ИИ в реальных приложениях зависят от трех ключевых понятий: движки для выводов (программное или аппаратное обеспечение, которое эффективно запускает модели ИИ), задержка выводов (задержка между вводом и выводом) и выводы в реальном времени (способность системы ИИ обрабатывать и реагировать с минимальной задержкой).

В этой статье мы рассмотрим эти основные понятия и то, как модели компьютерного зрения, такие как Ultralytics YOLO11, позволяют использовать приложения, которые зависят от мгновенного прогнозирования.

Что такое вывод ИИ?

Выполнение выводов - это процесс анализа новых данных с помощью обученной модели ИИ для составления прогноза или решения задачи. В отличие от обучения, которое заключается в обучении модели путем обработки огромного количества помеченных данных, при выводе выводов основное внимание уделяется быстрому и точному получению результатов с помощью уже обученной модели.

__wf_reserved_inherit
Рис. 1. Понимание того, что такое умозаключения.

Например, при охране дикой природы камеры-ловушки с искусственным интеллектом используют модели компьютерного зрения для идентификации и классификации животных в режиме реального времени. Когда камера обнаруживает движение, модель искусственного интеллекта мгновенно определяет, кто это - олень, хищник или даже браконьер, помогая исследователям отслеживать популяции животных и защищать исчезающие виды без вмешательства человека. Такая быстрая идентификация делает возможным мониторинг в режиме реального времени и быстрое реагирование на потенциальные угрозы.

Понимание механизмов вывода

Обученная модель машинного обучения не всегда готова к развертыванию в исходном виде. Механизм вывода - это специализированный программный или аппаратный инструмент, предназначенный для эффективного выполнения моделей машинного обучения и их оптимизации для развертывания в реальном мире. Он использует такие методы оптимизации, как сжатие модели, квантование и преобразование графов, для повышения производительности и снижения потребления ресурсов, что делает модель пригодной для развертывания в различных средах. 

По своей сути механизм вывода ориентирован на снижение вычислительных затрат, минимизацию задержек и повышение эффективности, чтобы обеспечить быстрые и точные прогнозы. После оптимизации движок выполняет модель на новых данных, позволяя ей эффективно генерировать выводы в режиме реального времени. Такая оптимизация обеспечивает бесперебойную работу моделей ИИ как на высокопроизводительных облачных серверах, так и на ограниченных по ресурсам граничных устройствах, таких как смартфоны, IoT-устройства и встраиваемые системы.

Проблемы, вызванные задержкой вывода

Задержка вывода - это временная задержка между получением системой ИИ входных данных (например, изображения с камеры) и выдачей выходных данных (например, обнаружением объектов на изображении). Даже небольшая задержка может существенно повлиять на производительность и удобство использования приложений ИИ в реальном времени.

Задержка вывода происходит на трех ключевых этапах:

  • Время предварительной обработки: Время, необходимое для подготовки исходных данных перед их вводом в модель. Сюда входит изменение размеров изображений для соответствия входным размерам модели, нормализация значений пикселей для повышения точности и преобразование форматов (например, RGB в оттенки серого или видео в последовательность кадров).
  • Время вычислений: Фактическое время, необходимое модели для выполнения вывода. Сюда входят такие операции, как послойные вычисления в глубоких сетях, умножение матриц, свертки и передача данных между памятью и блоками обработки.
  • Время постобработки: Время, необходимое для преобразования необработанных результатов модели в значимые результаты. Сюда можно отнести рисование ограничительных рамок при обнаружении объектов, фильтрацию ложных срабатываний при распознавании изображений или применение пороговых значений при обнаружении аномалий.

Задержка вывода имеет решающее значение в приложениях реального времени. Например, при автоматизированном обнаружении дефектов на сборочной линии компьютерное зрение может использоваться для проверки изделий по мере их движения по конвейеру. 

Система должна быстро выявлять и отмечать дефекты, прежде чем продукция перейдет на следующий этап. Если модель слишком долго обрабатывает изображения, дефектные изделия могут быть не обнаружены вовремя, что приведет к напрасной трате материалов, дорогостоящей доработке или попаданию бракованной продукции к заказчику. Сокращение времени ожидания позволяет производителям улучшить контроль качества, повысить эффективность и сократить потери.

Как уменьшить время ожидания вывода

Во многих приложениях компьютерного зрения важно поддерживать минимальную задержку вывода. Для достижения этой цели можно использовать различные техники. Давайте обсудим некоторые из наиболее распространенных методов, используемых для уменьшения задержки вывода.

Обрезка модели

Обрезка модели упрощает нейронную сеть, удаляя ненужные связи (веса), делая ее меньше и быстрее. Этот процесс снижает вычислительную нагрузку на модель, повышая скорость без сильного влияния на точность. 

Сохраняя только самые важные связи, обрезка обеспечивает эффективность выводов и лучшую производительность, особенно на устройствах с ограниченной вычислительной мощностью. Она широко используется в приложениях реального времени, таких как мобильный ИИ, робототехника и пограничные вычисления, для повышения эффективности при сохранении надежности.

__wf_reserved_inherit
Рис. 2. Устранение менее эффективных связей с помощью обрезки модели.

Квантование модели

Квантование модели - это техника, которая позволяет моделям ИИ работать быстрее и использовать меньше памяти за счет упрощения чисел, которые они используют для вычислений. Обычно такие модели работают с 32-битными числами с плавающей точкой, которые очень точны, но требуют больших вычислительных мощностей. Квантование сокращает эти числа до 8-битных целых чисел, которые легче обрабатывать и которые занимают меньше места. 

__wf_reserved_inherit
Рис. 3. Использование квантования модели для преобразования значений с плавающей точкой в целочисленные представления.

Использование эффективных моделей

Дизайн модели искусственного интеллекта оказывает большое влияние на то, насколько быстро она может делать предсказания. Такие модели, как YOLO11, созданные для эффективного вывода, идеально подходят для приложений, где скорость обработки данных имеет решающее значение.

При создании ИИ-решения важно выбрать правильную модель, исходя из имеющихся ресурсов и потребностей в производительности. Если вы начнете со слишком тяжелой модели, то, скорее всего, столкнетесь с такими проблемами, как медленное время обработки, повышенное энергопотребление и трудности с развертыванием на устройствах с ограниченными ресурсами. Легкая модель обеспечивает плавную работу, особенно для приложений реального времени и пограничных приложений.

Скорость против точности: оптимизация умозаключений в реальном времени

Хотя существуют различные методы уменьшения задержки, ключевой частью выводов в реальном времени является баланс между скоростью и точностью. Сделать модели быстрее недостаточно - необходимо оптимизировать скорость вывода без ущерба для точности. Система, которая делает быстрые, но неверные прогнозы, неэффективна. Именно поэтому необходимо проводить тщательное тестирование, чтобы убедиться, что модели хорошо работают в реальных условиях. Система, которая кажется быстрой во время тестирования, но не работает в реальных условиях, не является по-настоящему оптимизированной.

Приложения искусственного интеллекта, использующие умозаключения в реальном времени

Далее мы рассмотрим несколько реальных приложений, в которых использование выводов в реальном времени преобразует отрасли, позволяя мгновенно реагировать на визуальные данные.

Системы самоконтроля в розничных магазинах

Модели компьютерного зрения, подобные YOLO11, могут помочь улучшить системы самоконтроля, сделав распознавание товаров более быстрым и точным. Поддержка YOLO11 различных задач компьютерного зрения, таких как обнаружение объектов и сегментация экземпляров, позволяет идентифицировать товары, даже если штрих-коды отсутствуют или повреждены. ИИ на основе компьютерного зрения позволяет сократить необходимость ручного ввода и ускорить процесс оформления заказа.

Помимо идентификации товаров, компьютерное зрение может быть интегрировано в системы самоконтроля для проверки цен, предотвращения мошенничества и повышения удобства покупателей. Камеры на базе искусственного интеллекта могут автоматически различать похожие товары и выявлять подозрительное поведение на кассе. Это включает в себя выявление "несканирования", когда покупатель или кассир непреднамеренно пропускает товар, и более преднамеренных попыток мошенничества, таких как "подмена товара", когда более дешевый штрих-код помещается на более дорогой товар.

__wf_reserved_inherit
Рис. 4. ИИ может улучшить работу касс самообслуживания.

Отличный пример - компания Kroger, крупный американский ритейлер, который интегрировал компьютерное зрение и искусственный интеллект в свои системы самоконтроля. Используя видеоанализ в режиме реального времени, компания Kroger смогла автоматически исправить более 75 % ошибок на кассе, улучшив как обслуживание покупателей, так и работу магазинов.

Контроль качества с помощью компьютерного зрения

Вручную проверять продукцию для контроля качества может быть медленно и не всегда точно. Именно поэтому все больше производителей переходят на визуальный контроль, который использует компьютерное зрение для выявления дефектов на более ранних этапах производственного процесса.

Камеры высокого разрешения и искусственный интеллект Vision AI могут заметить крошечные недостатки, которые человек может пропустить, а такие модели, как YOLO11, помогут в режиме реального времени проверять качество, сортировать и подсчитывать, чтобы убедиться, что только идеальные продукты попадают к покупателям. Автоматизация этого процесса экономит время, сокращает расходы и уменьшает количество отходов, делая производство более плавным и эффективным.

__wf_reserved_inherit
Рис. 5. Пример использования YOLO11 для подсчета изделий на сборочной линии.

Основные выводы

Выводы в реальном времени помогают моделям ИИ принимать мгновенные решения, что крайне важно во многих отраслях. Будь то самоуправляемый автомобиль, избегающий аварии, врач, быстро анализирующий медицинские снимки, или завод, выявляющий дефекты продукции, - быстрые и точные ответы ИИ имеют большое значение.

Повышая скорость и эффективность моделей ИИ, мы сможем создавать более умные и надежные системы, которые будут бесперебойно работать в реальных условиях. По мере развития технологий решения на основе ИИ в реальном времени будут продолжать формировать будущее, делая повседневные процессы более быстрыми, безопасными и эффективными.

Чтобы узнать больше, посетите наш репозиторий GitHub и присоединяйтесь к нашему сообществу. Ознакомьтесь с инновациями в таких отраслях, как искусственный интеллект в самоуправляемых автомобилях и компьютерное зрение в сельском хозяйстве, на страницах наших решений. Ознакомьтесь с нашими вариантами лицензирования и воплотите в жизнь свои проекты в области искусственного интеллекта.

Давайте вместе построим будущее
искусственного интеллекта!

Начните свое путешествие в будущее машинного обучения

Начните бесплатно
Ссылка копируется в буфер обмена