Нажимая “Принять все файлы cookie”, вы соглашаетесь на сохранение файлов cookie на вашем устройстве с целью улучшения навигации по сайту, анализа использования сайта и помощи в наших маркетинговых усилиях. Подробнее
Настройки cookie
Нажимая “Принять все файлы cookie”, вы соглашаетесь на сохранение файлов cookie на вашем устройстве с целью улучшения навигации по сайту, анализа использования сайта и помощи в наших маркетинговых усилиях. Подробнее
Узнайте, почему выводы в реальном времени в компьютерном зрении важны для целого ряда приложений, и изучите их роль в обеспечении мгновенного принятия решений.
Все мы сталкивались с разочарованием, которое может вызвать медленное интернет-соединение. Однако представьте себе эту задержку в ситуации с высокими ставками, например, когда беспилотный автомобиль реагирует на препятствие или врач анализирует критически важный снимок. Несколько лишних секунд могут иметь серьезные последствия.
Именно здесь может помочь вывод ИИ в реальном времени. Быстрая обработка и прогнозы в реальном времени позволяют решениям компьютерного зрения мгновенно обрабатывать визуальные данные и реагировать на них. Эти решения, принимаемые за доли секунды, могут повысить безопасность, эффективность и повседневное удобство.
Например, представьте себе хирурга, выполняющего деликатную процедуру с помощью роботизированного ассистента. Каждое движение контролируется через высокоскоростное соединение, а система машинного зрения робота обрабатывает операционное поле в режиме реального времени, предоставляя хирургу мгновенную визуальную обратную связь. Даже малейшая задержка в этой петле обратной связи может привести к серьезным ошибкам, подвергая пациента риску. Это прекрасный пример того, почему выводы в режиме реального времени имеют решающее значение; здесь нет места для задержек.
Выводы ИИ в реальных приложениях зависят от трех ключевых концепций: механизмы логического вывода (программное или аппаратное обеспечение, которое эффективно запускает модели ИИ), задержка логического вывода (время задержки между вводом и выводом) и логический вывод в реальном времени (способность системы ИИ обрабатывать информацию и реагировать с минимальной задержкой).
В этой статье мы рассмотрим эти основные концепции и то, как модели компьютерного зрения, такие как Ultralytics YOLO11, позволяют создавать приложения, которые полагаются на мгновенные прогнозы.
Что такое инференс ИИ?
Запуск инференса — это процесс анализа новых данных с использованием обученной модели ИИ для прогнозирования или решения задачи. В отличие от обучения, которое включает в себя обучение модели путем обработки огромных объемов размеченных данных, инференс фокусируется на быстром и точном получении результатов с использованием уже обученной модели.
Например, в охране дикой природы AI-камеры-ловушки используют модели компьютерного зрения для идентификации и классификации животных в режиме реального времени. Когда камера обнаруживает движение, модель AI мгновенно распознает, является ли это олень, хищник или даже браконьер, помогая исследователям отслеживать популяции животных и защищать исчезающие виды без вмешательства человека. Эта быстрая идентификация делает возможным мониторинг в реальном времени и более быстрое реагирование на потенциальные угрозы.
Понимание механизмов inference
Обученная модель машинного обучения не всегда готова к развертыванию в исходном виде. Механизм логического вывода — это специализированный программный или аппаратный инструмент, предназначенный для эффективного выполнения моделей машинного обучения и их оптимизации для развертывания в реальных условиях. Он использует методы оптимизации, такие как сжатие модели, квантование и преобразование графов, для повышения производительности и снижения потребления ресурсов, что позволяет развертывать модель в различных средах.
По сути, механизм логического вывода (inference engine) фокусируется на снижении вычислительных затрат, минимизации задержек и повышении эффективности для обеспечения быстрых и точных прогнозов. После оптимизации механизм выполняет модель на новых данных, позволяя ей эффективно генерировать выводы в реальном времени. Эта оптимизация гарантирует, что модели ИИ могут бесперебойно работать как на высокопроизводительных облачных серверах, так и на периферийных устройствах с ограниченными ресурсами, таких как смартфоны, устройства IoT и встроенные системы.
Проблемы, вызванные задержкой инференса
Задержка инференса — это временная задержка между моментом, когда система искусственного интеллекта получает входные данные (например, изображение с камеры), и моментом, когда она выдает выходные данные (например, обнаружение объектов на изображении). Даже небольшая задержка может существенно повлиять на производительность и удобство использования приложений ИИ в реальном времени.
Задержка инференса возникает на трех ключевых этапах:
Время предварительной обработки: Время, необходимое для подготовки входных данных перед их подачей в модель. Это включает в себя изменение размера изображений в соответствии с входными размерами модели, нормализацию значений пикселей для повышения точности и преобразование форматов (например, RGB в оттенки серого или видео в последовательности кадров).
Время вычислений: Фактическое время, которое требуется модели для выполнения логического вывода. Это включает в себя такие операции, как послойные вычисления в глубоких сетях, умножение матриц, свертки и передача данных между памятью и вычислительными блоками.
Время постобработки (Post-processing time): Время, необходимое для преобразования необработанных выходных данных модели в значимые результаты. Это может включать рисование ограничивающих рамок при обнаружении объектов, фильтрацию ложных срабатываний при распознавании изображений или применение порогов при обнаружении аномалий.
Задержка инференса имеет решающее значение в приложениях реального времени. Например, при автоматизированном обнаружении дефектов на сборочной линии компьютерное зрение может использоваться для проверки продукции по мере ее продвижения по конвейерной ленте.
Система должна быстро выявлять и отмечать дефекты до того, как продукты перейдут на следующий этап. Если модель занимает слишком много времени для обработки изображений, дефектные элементы могут быть не обнаружены вовремя, что приведет к напрасной трате материалов, дорогостоящим переделкам или неисправным продуктам, попадающим к клиентам. Снижая задержку, производители могут улучшить контроль качества, повысить эффективность и сократить потери.
Как уменьшить задержку при выводе (inference latency)
Поддержание минимальной задержки инференса имеет важное значение во многих приложениях компьютерного зрения. Для достижения этого можно использовать различные методы. Давайте обсудим некоторые из наиболее распространенных методов, используемых для снижения задержки инференса.
Оптимизация (pruning) модели
Упрощение модели упрощает нейронную сеть, удаляя ненужные соединения (веса), делая ее меньше и быстрее. Этот процесс снижает вычислительную нагрузку модели, повышая скорость без существенного влияния на точность.
Сохраняя только самые важные соединения, прунинг обеспечивает эффективный вывод и лучшую производительность, особенно на устройствах с ограниченной вычислительной мощностью. Он широко используется в приложениях реального времени, таких как мобильный ИИ, робототехника и периферийные вычисления, для повышения эффективности при сохранении надежности.
Рис. 2. Устранение менее эффективных связей с помощью обрезки модели.
Квантование модели
Квантование модели — это метод, который позволяет моделям ИИ работать быстрее и использовать меньше памяти за счет упрощения чисел, используемых для вычислений. Обычно эти модели работают с 32-битными числами с плавающей запятой, которые очень точны, но требуют большой вычислительной мощности. Квантование уменьшает эти числа до 8-битных целых чисел, которые легче обрабатывать и занимают меньше места.
Рис. 3. Использование квантования модели для преобразования значений с плавающей запятой в целочисленные представления.
Использование эффективных моделей
Архитектура модели ИИ оказывает значительное влияние на скорость прогнозирования. Модели, такие как YOLO11, разработанные для эффективного вывода, идеально подходят для приложений, где скорость обработки имеет решающее значение.
При создании решения на основе ИИ важно выбрать правильную модель, исходя из доступных ресурсов и потребностей в производительности. Если вы начнете с модели, которая слишком тяжелая, вы, скорее всего, столкнетесь с такими проблемами, как низкая скорость обработки, более высокое энергопотребление и трудности с развертыванием на устройствах с ограниченными ресурсами. Легкая модель обеспечивает плавную работу, особенно для приложений реального времени и периферийных вычислений.
Скорость и точность: оптимизация логических выводов в реальном времени
Хотя существуют различные методы уменьшения задержки, ключевой частью выводов в реальном времени является баланс между скоростью и точностью. Недостаточно просто сделать модели быстрее - скорость вывода необходимо оптимизировать без ущерба для точности. Система, которая выдает быстрые, но неверные прогнозы, неэффективна. Вот почему тщательное тестирование жизненно важно, чтобы убедиться, что модели хорошо работают в реальных ситуациях. Система, которая кажется быстрой во время тестирования, но терпит неудачу в реальных условиях, не является по-настоящему оптимизированной.
Приложения Vision AI, использующие логические выводы в реальном времени
Далее, давайте рассмотрим несколько реальных приложений, в которых вывод в реальном времени преобразует отрасли, обеспечивая мгновенную реакцию на визуальный ввод.
Системы самообслуживания в розничных магазинах
Модели компьютерного зрения, такие как YOLO11, могут помочь улучшить системы самообслуживания, сделав распознавание товаров более быстрым и точным. Поддержка YOLO11 различных задач компьютерного зрения, таких как обнаружение объектов и сегментация экземпляров, позволяет идентифицировать продукты, даже если штрих-коды отсутствуют или повреждены. Vision AI может уменьшить потребность в ручном вводе и ускорить процесс оформления заказа.
Помимо идентификации продукта, компьютерное зрение также может быть интегрировано в системы самообслуживания для проверки цен, предотвращения мошенничества и повышения удобства для клиентов. Камеры с поддержкой ИИ могут автоматически различать похожие продукты и обнаруживать подозрительное поведение при оформлении заказа. Это включает в себя выявление «непросканированных» товаров, когда клиент или кассир случайно пропускает товар, и более преднамеренные попытки мошенничества, такие как «подмена продукта», когда более дешевый штрих-код помещается поверх более дорогого товара.
Отличным примером этого является Kroger, крупный американский ритейлер, который интегрировал компьютерное зрение и ИИ в свои системы самообслуживания. Используя анализ видео в реальном времени, Kroger смог автоматически исправить более 75% ошибок при оформлении покупок, улучшив как качество обслуживания клиентов, так и работу магазинов.
Контроль качества с использованием компьютерного зрения
Ручная проверка продукции для контроля качества может быть медленной и не всегда точной. Вот почему все больше производителей переходят на рабочие процессы визуального контроля, в которых используется компьютерное зрение для выявления дефектов на более ранних этапах производственного процесса.
Камеры высокого разрешения и Vision AI могут обнаруживать мельчайшие дефекты, которые могут пропустить люди, а такие модели, как YOLO11, могут помочь с проверкой качества в реальном времени, сортировкой и подсчетом, чтобы гарантировать, что только идеальные продукты попадут к клиентам. Автоматизация этого процесса экономит время, сокращает затраты и уменьшает количество отходов, делая производство более плавным и эффективным.
Рис. 5. Пример использования YOLO11 для подсчета продукции на сборочной линии.
Основные выводы
Инференс в реальном времени помогает моделям ИИ принимать мгновенные решения, что имеет решающее значение во многих отраслях. Будь то самоуправляемый автомобиль, избегающий аварии, врач, быстро анализирующий медицинские снимки, или фабрика, обнаруживающая дефекты продукции, быстрые и точные ответы ИИ имеют большое значение.
Повышая скорость и эффективность моделей ИИ, мы можем создавать более интеллектуальные и надежные системы, которые бесперебойно работают в реальных условиях. По мере развития технологий решения ИИ в реальном времени будут продолжать формировать будущее, делая повседневные процессы быстрее, безопаснее и эффективнее.