Создание умных продуктов с помощью Ultralytics YOLO26 и vision AI
Узнай, как создание умных продуктов с помощью YOLO26 и vision AI обеспечивает обнаружение в реальном времени, интеллектуальную автоматизацию и масштабируемый, отзывчивый пользовательский опыт.
Тысячи часов видео записываются ежедневно камерами, встроенными в устройства, оборудование и объекты общественной инфраструктуры. Большая часть этих данных просто сохраняется, просматривается или проверяется только в случае возникновения проблем.
Часто визуальные данные доступны, но не хватает возможности интерпретировать их в режиме реального времени. По мере того как продукты становятся более сетевыми и ориентированными на данные, это ограничение становится всё заметнее.
Пользователи ожидают, что системы будут делать больше, чем просто записывать события или следовать фиксированным инструкциям. Например, они ждут, что умные продукты будут распознавать происходящее и реагировать немедленно, не дожидаясь ручной проверки и не полагаясь на жесткие наборы правил.
Последние достижения в области искусственного интеллекта помогают устранить этот разрыв. В частности, computer vision позволяет машинам интерпретировать изображения и видео, благодаря чему системы могут анализировать сцены и реагировать в реальном времени.
Однако для внедрения этой возможности в продукт требуются модели, которые одновременно быстры и надежны. Передовые модели компьютерного зрения, такие как Ultralytics YOLO26, созданы именно для этого, обеспечивая скорость и точность, необходимые для развертывания в реальном времени.
YOLO26 поддерживает основные задачи зрения, такие как обнаружение объектов, сегментация экземпляров и отслеживание объектов, что позволяет продуктам интерпретировать визуальные данные и реагировать интеллектуально.

Рис 1. Обнаружение объектов на изображении с помощью YOLO26 (Источник)
В этой статье мы рассмотрим, как компьютерное зрение и Ultralytics YOLO26 можно использовать для создания более умных продуктов и поддержки интеллектуальной автоматизации в реальных сценариях. Давай начнем!
Link to this sectionПробелы в традиционной разработке продуктов#
Прежде чем погрузиться в то, как компьютерное зрение помогает создавать более умные продукты, давай внимательно рассмотрим проблемы, с которыми сталкиваются команды, полагаясь на традиционные, основанные на правилах системы и старые алгоритмы.
Вот некоторые из ключевых проблем традиционной разработки продуктов:
- Жесткие системы, основанные на правилах: Жестко запрограммированная логика может работать в контролируемых средах, но реальные условия редко предсказуемы. Незначительные изменения в освещении, угле обзора камеры или внешнем виде объекта могут быстро нарушить предопределенные правила и снизить точность.
- Плохая адаптивность к изменчивости реального мира: Традиционные системы плохо приспосабливаются к новым или неожиданным сценариям. Обновления часто требуют ручной настройки и повторной оптимизации, что замедляет улучшение продуктов и увеличивает затраты на поддержку.
- Ограничения масштабируемости: По мере роста объема данных изображений и видео старые конвейеры обработки изображений перестают справляться. Обработка замедляется, что затрудняет поддержание производительности в реальном времени при работе с потоками видео.
- Высокая задержка в сценариях реального времени: Многие традиционные подходы не могут обрабатывать непрерывные визуальные потоки достаточно быстро. Задержки в выводе ослабляют автоматизацию и снижают общую отзывчивость.
- Дорогие требования к вычислительным ресурсам: Достижение приемлемой точности часто требует значительных аппаратных ресурсов, включая выделенные графические процессоры (GPUs), что увеличивает затраты на инфраструктуру.
Link to this sectionРоль компьютерного зрения в создании более умных продуктов#
Далее, давай посмотрим, как компьютерное зрение может поддерживать более умное поведение продукта.
Большинство современных подключенных продуктов уже собирают визуальные данные в рамках своих обычных операционных процессов. Камеры встроены в различные устройства, установлены в физических пространствах и связаны через системы Интернета вещей (IoT).
В результате изображения и видео постоянно записываются в фоновом режиме. Проблема не в сборе этих данных.
Сложность заключается в осмыслении собранных данных в реальном времени. Без визуального интеллекта отснятый материал просто сохраняется и просматривается позже, часто уже после того, как проблема произошла.
Компьютерное зрение меняет ситуацию. Используя нейронные сети, обученные распознавать паттерны, системы могут анализировать изображения и видео в реальном времени. Вместо того чтобы полагаться на фиксированные правила или ручные проверки, продукты могут интерпретировать происходящее в сцене и реагировать по мере наступления событий.
Чтобы внедрить эту визуальную возможность в продукты, команды могут полагаться на эффективные модели компьютерного зрения, такие как Ultralytics YOLO26. YOLO26 поддерживает ключевые задачи зрения и может помочь продуктам интерпретировать визуальную информацию достаточно быстро, чтобы принимать решения в режиме реального времени.
Link to this sectionСтроительные блоки продуктов на базе зрения#
Вот краткий обзор того, как задачи компьютерного зрения могут способствовать созданию более умных продуктов:
- Обнаружение объектов: Эта задача позволяет идентифицировать и находить соответствующие объекты в каждом кадре с помощью ограничивающей рамки и назначать показатель достоверности, давая четкое понимание того, что присутствует на изображении.
- Отслеживание объектов: Может использоваться для сопровождения конкретных объектов через несколько кадров, позволяя системе зрения понимать движение и изменения с течением времени.
- Классификация изображений: Эта задача назначает метку всему изображению на основе его основного содержания. Она классифицирует сцены или идентифицирует конкретные условия в кадре.
- Сегментация экземпляров: Позволяет точно обвести объекты на уровне пикселей, помогая продуктам лучше интерпретировать формы, границы и пространственные отношения.
- Оценка позы: Эта задача обнаруживает ключевые точки на теле человека или других артикулированных объектах. Она фиксирует осанку, движение и физические взаимодействия в реальном времени.
- Обнаружение с помощью ориентированных ограничивающих рамок (OBB): Позволяет обнаруживать объекты с использованием повернутых ограничивающих рамок вместо стандартных горизонтальных. Улучшает точность локализации, когда объекты появляются под углами или в плотно упакованных средах.
Когда эти возможности применяются к непрерывным визуальным данным, продукты могут реагировать быстрее, автоматизировать более надежно и предоставлять опыт, который ощущается осознанным, а не реактивным. Вместо того чтобы ждать, пока события будут просмотрены позже, системы могут понимать и действовать в моменте.
Link to this sectionКак модели зрения реального времени обеспечивают интеллектуальное поведение продуктов#
По мере того как ты узнаешь больше о продуктах на базе зрения, ты можешь задаться вопросом, как система переходит от простого видеозаписывающего устройства к фактическому реагированию в реальном времени.
Все начинается с распознавания того, что находится перед камерой. По мере поступления видеопотока модель зрения анализирует каждый кадр и идентифицирует элементы, которые имеют значение, например, конкретные объекты или людей. Вместо того чтобы реагировать на каждое движение, система фокусируется только на релевантных сигналах.
Еще один ключевой аспект — скорость. Системы реального времени должны обрабатывать каждый кадр быстро и последовательно, гарантируя, что обнаружение и принятие решений происходят без заметной задержки.
Например, семейство моделей Ultralytics YOLO (You Only Look Once) было создано для обработки визуальных данных в реальном времени. Модели, такие как Ultralytics YOLO26, опираются на предыдущие версии, такие как Ultralytics YOLOv5, Ultralytics YOLOv8 и Ultralytics YOLO11, включая архитектурные доработки, оптимизацию производительности и улучшения эффективности. Результатом является повышенная скорость и точность, даже в сложных реальных условиях.
При интеграции в продукт эти модели работают непрерывно в фоновом режиме, анализируя каждый кадр по мере его поступления. Система проверяет предопределенные условия, и, как только они выполняются, может мгновенно активировать оповещение, обновить рабочий процесс или инициировать действие.
Это делает системы на базе зрения более отзывчивыми, масштабируемыми и практичными для интеграции в среды, начиная от робототехники и автономных транспортных средств до умного дома и систем безопасности. Для бизнес-лидеров это означает более быстрые ответы, меньше ручных проверок и автоматизацию, которая кажется надежной, а не реактивной.
Link to this sectionИспользование YOLO26 для обеспечения визуального интеллекта в реальном времени в продуктах#
Модели Ultralytics YOLO, включая YOLO26, доступны «из коробки» как предобученные модели. Это означает, что они уже обучены на больших, широко используемых наборах данных, таких как COCO.
Благодаря этому предобучению YOLO26 может немедленно распознавать распространенные объекты реального мира. Это дает продуктовым командам практическую отправную точку, означая, что они могут создавать визуальные функции без обучения модели с нуля.
Для более специфических нужд продукта эти предобученные модели могут быть дополнительно дообучены (fine-tuned) с использованием доменно-специфичных данных с высококачественными аннотациями.
Например, рассмотри ресторан, оснащенный потолочными камерами. Специально обученная модель AI зрения, такая как YOLO26, может обнаруживать, сколько людей находится внутри помещения. Она может идентифицировать, какие столики заняты, а какие стулья свободны.

Рис 2. YOLO26 обеспечивает обнаружение в реальном времени людей, свободных мест и работающих касс в розничных магазинах. (Источник)
В таком сценарии YOLO26 выступает в роли визуального движка, работающего непрерывно в фоновом режиме. Команды также могут развертывать такие модели на edge-устройствах в зависимости от потребностей в производительности и целей по энергоэффективности.
Link to this sectionРеальные приложения моделей YOLO в умных продуктах#
Теперь, когда у нас есть лучшее понимание того, как работают модели зрения в реальном времени, давай посмотрим, как модели Ultralytics YOLO могут быть применены в умных продуктах для разных сценариев использования, чтобы сделать их более осведомленными, отзывчивыми и способными действовать на основе того, что они видят.
Link to this sectionИнтеллект продуктов здравоохранения с YOLO#
Когда дело доходит до хирургического обучения в здравоохранении, часы записей процедур часто просматриваются вручную для оценки владения инструментами и рабочего процесса. Этот процесс может занимать много времени и сильно зависеть от человеческого наблюдения.
С моделью зрения на базе YOLO, интегрированной в систему, видеопотоки могут анализироваться автоматически по мере выполнения процедур. Модель может обнаруживать хирургические инструменты в реальном времени и идентифицировать, где и когда они используются.
Это позволяет структурировать логирование, улучшить аналитику и получать высококачественные сведения о производительности без постоянного ручного просмотра. Фактически, исследования с использованием модели YOLO11, которая является предшественником новейшей модели YOLO26, показали, что обнаружение лапароскопических инструментов в реальном времени может эффективно работать даже на встроенных системах.

Рис 3. Обнаружение лапароскопических инструментов в реальном времени с использованием YOLO (Источник)
Модель поддерживала высокую точность, работая достаточно быстро для условий живой хирургии. Это показывает, как глубокое обучение может поддерживать надежную визуальную обратную связь в реальном времени во время процедур.
Link to this sectionСоздание умного розничного опыта на базе YOLO#
Мы все стояли перед переполненной полкой супермаркета, пытаясь найти нужный продукт. Многие товары выглядят одинаково, этикетки маленькие, а продукты часто стоят не на своем месте.
Для ритейлеров это затрудняет видимость полок в реальном времени. ИИ зрения и модели обнаружения объектов YOLO могут помочь системным магазинам понимать, что на самом деле находится на полке через видеопотоки с камер. Это снижает зависимость от сканирования штрих-кодов и ручных проверок, делая мониторинг полок более точным и отзывчивым.

Рис 4. Обнаружение и сегментация товаров на полках супермаркета с помощью YOLO26
Благодаря такой точности ритейлерам больше не нужно полагаться только на периодические ручные проверки. Полки могут контролироваться непрерывно через живое видео.
Низкий уровень запасов может быть отмечен сразу, неправильно размещенные продукты замечены быстрее, а процессы оплаты могут проходить более гладко. Это дает ритейлерам лучший операционный контроль, создавая при этом более бесшовный опыт покупок для клиентов.
Link to this sectionИИ зрения и автономная навигация#
Автономные системы могут быть очень эффективными, но они часто полагаются на фиксированные маршруты или заданные координаты. Хотя это работает в стабильных средах, условия реального мира редко остаются неизменными.
Решения ИИ зрения, основанные на моделях глубокого обучения, позволяют машинам понимать свое окружение и адаптироваться в реальном времени. Благодаря сочетанию компьютерного зрения с адаптивными алгоритмами системы могут реагировать на изменения по мере их возникновения, вместо того чтобы полагаться на жесткие, предварительно запрограммированные инструкции.
Итак, как это работает в реальных условиях? Давай возьмем пример робота, работающего на складе. Камеры непрерывно фиксируют окружающую обстановку, а модель зрения выполняет обнаружение объектов в реальном времени для идентификации препятствий, стеллажей и путей.
Эти обнаружения поддерживают локализацию, помогая роботу определить свое точное положение внутри объекта. На основе этих визуальных данных алгоритмы оптимизации мгновенно корректируют его маршрут, позволяя ему эффективно перемещаться и поддерживать плавную автоматизацию даже при изменении условий.
Link to this sectionМониторинг инфраструктуры и более умное обнаружение дефектов#
ЛЭП и оборудование энергосетей нуждаются в регулярной проверке для обеспечения безопасности и надежности. В большинстве случаев эти инспекции инженерных сетей все еще требуют ручных проверок, которые отнимают много времени и трудно управляются на больших или удаленных территориях.
ИИ зрения предлагает более простой способ следить за инфраструктурой без зависимости только от запланированных выездов на место. Модели, такие как YOLO26, могут обнаруживать дефекты на изоляторах ЛЭП, включая трещины, коррозию или видимые повреждения, непосредственно с изображений, полученных в реальных уличных условиях.
Анализируя визуальные данные в реальном времени, такие системы могут отмечать потенциальные проблемы, которые в противном случае могли бы остаться незамеченными. Раннее выявление этих проблем снижает риск выхода оборудования из строя, минимизирует неожиданные отключения и поддерживает более проактивные операции по обслуживанию.
Link to this sectionИзмерение ROI умных продуктов на базе зрения#
Для бизнес-лидеров ИИ зрения — это не просто техническая производительность. Это измеримое влияние на бизнес.
При вдумчивом внедрении системы на базе зрения могут повысить эффективность, снизить затраты и увеличить точность. Эти достижения также способствуют улучшению пользовательского опыта и более высокой общей производительности.
Вот несколько областей, где это влияние становится очевидным:
- Снижение ручных усилий: Системы зрения автоматизируют повторяющиеся задачи инспекции, мониторинга и верификации, снижая зависимость от ручных процессов и высвобождая время команд для более стратегической работы.
- Более быстрые циклы принятия решений: Визуальный анализ в реальном времени позволяет системам мгновенно обнаруживать проблемы или инициировать действия, сокращая время отклика и обеспечивая плавную работу операций.
- Меньше операционных ошибок: Автоматизированное обнаружение приносит последовательность. Снижая человеческий надзор в рутинных задачах, организации часто видят меньше ошибок и более надежные результаты.
- Улучшенное вовлечение пользователей: Продукты, которые могут видеть и реагировать интеллектуально, ощущаются более интерактивными и актуальными. Это приводит к большему доверию пользователей, лучшему опыту и более долгосрочному принятию.
Link to this sectionОсновные выводы#
ИИ зрения позволяет продуктам интерпретировать визуальную информацию в реальном времени, поддерживая более умную автоматизацию и более отзывчивый опыт. С такими возможностями, как обнаружение, отслеживание и сегментация, системы выходят за рамки базовых правил к контекстно-зависимым решениям. Эффективные модели, такие как Ultralytics YOLO26, делают практичным создание масштабируемых, конкурентоспособных продуктов на базе зрения.
Присоединяйся к нашему активному сообществу и открывай для себя инновации, такие как ИИ в производстве и ИИ зрения в рознице. Посети наш репозиторий GitHub и начни работу с компьютерным зрением уже сегодня, ознакомившись с нашими вариантами лицензирования.






