Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Vision AI

Будущие тренды обнаружения объектов: 7 ключевых моментов, на которые стоит обратить внимание

Узнай о семи будущих трендах в обнаружении объектов, которые способствуют развитию компьютерного зрения, делая системы на базе ИИ более быстрыми, умными и надежными.

АБАбирами Вина
5 min read
Будущие тренды обнаружения объектов в компьютерном зрении

Роботакси уже курсируют по улицам Сан-Франциско, а люди перешли от поиска ответов в сети к общению с ИИ как части своей повседневной жизни. Эти изменения ясно дают понять, что искусственный интеллект (ИИ) развивается быстрее, чем когда-либо, и становится неотъемлемой частью нашей жизни.

Например, одна из областей, развивающихся невероятными темпами, — это технология computer vision. Иначе известная как vision AI, это подполе ИИ, которое помогает машинам интерпретировать и понимать визуальные данные.

Computer vision уже встречается повсюду: от автоматизированных касс до дронов, осматривающих линии электропередач. В основе многих из этих систем лежит object detection — ключевая задача компьютерного зрения, позволяющая машинам распознавать и находить конкретные объекты на изображениях и видео.

По мере ускорения внедрения ИИ растет и спрос на быстрое и точное обнаружение объектов. Модели vision AI, такие как Ultralytics YOLO11 и предстоящая Ultralytics YOLO26, были созданы с учетом этого, что делает обнаружение объектов в реальном времени более надежным и доступным, чем когда-либо.

Использование YOLO11 для обнаружения объектов

Рис. 1. Пример использования YOLO11 для обнаружения объектов.

Благодаря этому стремительному прогрессу отрасль быстро меняется, и несколько новых трендов формируют облик следующего поколения систем обнаружения объектов. В этой статье мы рассмотрим семь ключевых тенденций, которые определяют будущее этой технологии.

Link to this sectionПонимание принципов работы обнаружения объектов#

Прежде чем мы перейдем к будущим трендам в обнаружении объектов, давай сделаем шаг назад и посмотрим, что это такое, как оно работает «под капотом» и как развивалось с течением времени.

Обнаружение объектов — это ключевая часть computer vision, которая позволяет ИИ-системам определять, что находится на изображении, и точно указывать, где появляется каждый предмет. Чтобы научиться этому, модели обучаются на больших размеченных наборах данных, показывающих объекты в самых разных условиях: под разным углом, при разном освещении, в разных размерах и компоновках.

Со временем модель усваивает закономерности и визуальные подсказки, которые отличают один объект от другого. После обучения vision AI модели, такие как Ultralytics YOLO, могут сканировать всё изображение за один проход, мгновенно рисуя ограничивающие рамки (bounding boxes) и присваивая метки. Именно эта скорость и точность делают обнаружение объектов эффективным для реальных задач.

Обнаружение рентгеновского снимка с помощью модели YOLO11

Рис. 2. Обнаружение на рентгеновском снимке с помощью модели YOLO11. (Источник)

Link to this sectionПример использования обнаружения объектов в реальных задачах#

Например, в области document analysis такие компании, как Prezent, используют обнаружение объектов для автоматизации сложной задачи по переработке презентационных слайдов. Традиционно этот процесс требовал часов ручной работы: поиск заголовков, изменение размера текстовых блоков, выравнивание изображений и пересоздание графиков — и всё это при попытке сохранить чистый и последовательный макет.

Преобразуя каждый слайд в изображение, модели Ultralytics YOLO могут обнаруживать заголовки, текстовые блоки, изображения и графики, сохраняя при этом исходную структуру. Это дает системе точное понимание того, как расположен каждый элемент. Благодаря этой информации весь процесс переработки, который раньше был долгим и утомительным, теперь можно автоматизировать за считанные секунды.

Link to this sectionЭволюция обнаружения объектов в computer vision#

Вот краткий обзор того, как развивалось обнаружение объектов на протяжении многих лет:

  • Начало пути (1960-е – 1970-е гг.): Ранние методы обнаружения объектов происходили из традиционной обработки изображений и часто полагались на сопоставление с шаблонами (template matching). В этом подходе компьютеры сравнивали части изображения (пиксели) с предопределенными эталонными шаблонами для поиска сходств. Поскольку эти шаблоны были фиксированными и не могли адаптироваться к изменениям, метод работал только в идеальных условиях. Даже небольшие вариации в освещении, масштабе, повороте или внешнем виде объекта приводили к сбоям.

  • Обнаружение на основе признаков (1990-е – 2000-е гг.): Затем исследователи перешли к идее рукотворных признаков и их извлечения, где люди вручную определяли визуальные ключи, которые должен искать компьютер, такие как края, углы, формы или изменения яркости. Методы вроде Haar Cascades (метод поиска простых визуальных паттернов, часто используемый для обнаружения лиц) и HOG (техника захвата направлений краев и контуров изображения), часто сочетавшиеся с SVM-классификаторами (модель машинного обучения, разделяющая объекты на категории), сделали распознавание объектов точнее и быстрее. Но даже с этими улучшениями системы всё еще не могли работать достаточно быстро для использования в реальном времени.

  • Революция моделей глубокого обучения (2010-е гг.): Глубокое обучение и сверточные нейронные сети (CNN), которые представляют собой модели, разработанные для изучения визуальных паттернов путем сканирования изображений небольшими областями, переопределили обнаружение объектов. Модели, такие как R-CNN, Fast R-CNN и Faster R-CNN, изучали визуальные паттерны непосредственно из больших объемов данных. Это привело к высокой точности результатов, но эти модели всё еще сталкивались с проблемами задержки.

  • Обнаружение в реальном времени с YOLO (середина 2010-х гг.): YOLO (You Only Look Once) ознаменовал крупный прорыв в обнаружении объектов, предсказывая все ограничивающие рамки (bounding boxes) и классы меток за один проход через сеть. Этот унифицированный подход резко увеличил скорость обнаружения и открыл путь для приложений, работающих в реальном времени. Примерно в то же время другие модели однократного прохода, такие как SSD (Single Shot Detector), также улучшили производительность за счет удаления этапов предложения регионов (region proposal), что сделало обнаружение объектов быстрее и эффективнее.

  • Недавние достижения (2020-е гг.): Благодаря значительным улучшениям в проектировании и оптимизации моделей, 2020-е годы принесли более быстрые и точные современные системы и фреймворки для обнаружения объектов. Ultralytics YOLO11 представил архитектурные обновления, которые улучшили скорость обработки, точность и общую производительность в реальном времени. Опираясь на этот импульс, предстоящая YOLO26 отличается еще более эффективным и легким дизайном, что делает её подходящей для широкого спектра практических применений.

Link to this section7 трендов в обнаружении объектов, определяющих будущее#

Далее давай рассмотрим семь развивающихся трендов в обнаружении объектов, которые привлекают внимание и создают ажиотаж в области computer vision.

Link to this sectionБолее умные задачи по обнаружению объектов с помощью edge computing#

Традиционные ручные проверки могут замедлить производственные линии и оставить вероятность пропуска дефектов. Чтобы справиться с этим, многие компании переходят на ИИ-системы контроля качества, основанные на обнаружении объектов.

Фактически, исследования показывают, что AI-based visual inspection может значительно повысить производительность, иногда на целых 50%, и увеличить процент обнаружения дефектов до 90% по сравнению с ручной проверкой. Интересно, что новый тренд, набирающий популярность в этой сфере и других приложениях vision AI, заключается в том, что этот анализ теперь выполняется непосредственно на самих устройствах с помощью edge computing.

Благодаря edge computing интеллектуальные функции приближаются к месту сбора данных. Камеры и сенсоры могут запускать модели обнаружения объектов на месте, мгновенно идентифицируя объекты и определяя их местоположение, не полагаясь на облачную обработку. Это позволяет им анализировать кадры в реальном времени.

Это также снижает сетевые задержки, уменьшает использование полосы пропускания и гарантирует, что системы продолжат работать, даже если интернет-соединение нестабильно или отсутствует. Для динамичных сред, таких как производство, этот переход к обработке на устройстве обеспечивает более быстрые ответы, более плавную работу и гораздо более надежные результаты.

Link to this sectionДиагностика на основе зрения в здравоохранении#

Врачи часто тратят много времени на просмотр медицинских изображений, чтобы убедиться, что ничего не упущено. В настоящее время многие больницы начинают изучать передовые технологии обнаружения объектов, чтобы ускорить этот процесс. Это отражает более широкую тенденцию в здравоохранении, где vision AI всё чаще используется для поддержки раннего выявления, более быстрой постановки диагноза и более последовательного анализа изображений.

Обнаружение объектов можно использовать для быстрого выделения областей, требующих внимания, что улучшает принятие решений и результаты лечения пациентов. Например, такие модели, как YOLO11, могут помочь врачам заметить опухоли мозга на МРТ-сканах.

Обнаружение и локализация опухолей головного мозга на МРТ-сканах с помощью YOLO11

Рис. 3. Обнаружение и локализация опухолей мозга на МРТ-сканах с помощью YOLO11. (Источник)

Поскольку YOLO11 может распознавать тонкие паттерны на МРТ-сканах, он может помочь выявлять небольшие или ранние стадии опухолей с большей точностью. Хотя врачи принимают окончательный диагноз, инструменты вроде YOLO11 могут помочь оптимизировать их работу, заранее подсвечивая потенциальные проблемы и помогая убедиться, что ничего важного не пропущено.

Link to this sectionАвтономные транспортные средства и зрение в реальном времени для более безопасной мобильности#

На оживленных городских улицах беспилотные автомобили полагаются на камеры и сенсоры для постоянного мониторинга окружающей обстановки. Эти системы обнаруживают пешеходов, транспорт, полосы движения и дорожные знаки в реальном времени. С помощью компьютерного зрения и алгоритмов обнаружения объектов автономный автомобиль может интерпретировать происходящее вокруг и принимать более безопасные решения во время движения.

В регионах с разнообразными схемами движения и смешанным потоком транспорта эти системы сталкиваются с дополнительной сложностью. Например, недавнее исследование оценило модели Ultralytics YOLOv8 на traffic data, собранных в Хайдарабаде и Бангалоре, где самые разные транспортные средства, такие как автомобили, автобусы, мотоциклы, велосипеды и авторикши, делят дорогу динамичным и зачастую непредсказуемым образом.

Результаты показали, что YOLOv8 продемонстрировал отличные показатели в этих сложных сценариях, точно обнаруживая широкий спектр объектов даже в условиях плотного и неструктурированного трафика. Это подчеркивает растущий тренд в автономной мобильности: модели vision AI становятся всё более способными справляться со сложными реальными условиями, которые когда-то создавали серьезные трудности для автоматизированных систем.

Link to this sectionУмная автоматизация и робототехника с использованием computer vision#

Обработка мелких объектов, сортировка обнаруженных предметов и материалов или навигация в загроможденных пространствах всегда были сложной задачей для роботов. Эти задачи требуют быстрой адаптации и точного движения — того, с чем традиционные системы автоматизации часто испытывают трудности в непредсказуемых условиях.

Растущим трендом в робототехнике является использование vision AI для предоставления роботам способности воспринимать окружающую среду и реагировать на неё в реальном времени. Чтобы исследовать этот сдвиг, группа исследователей недавно разработала household robot, способного распознавать и сортировать объекты при перемещении в помещении.

Используя модели вроде YOLO11 для обнаружения объектов, вместе с камерой глубины и гибким захватом, робот смог самостоятельно идентифицировать предметы разных форм и размеров и помещать их в правильные места. Этот эксперимент показывает, как сочетание компьютерного зрения с роботизированными системами может улучшить пространственное восприятие и отзывчивость.

Робот, использующий YOLO11 и датчики глубины для интеллектуального принятия решений

Рис. 4. Робот, который использует YOLO11 и датчик глубины для интеллектуального принятия решений. (Источник)

Это также демонстрирует, как передовые методы ИИ помогают роботам адаптироваться к незнакомым средам, обучаясь на визуальных паттернах с течением времени. С этими достижениями роботы становятся всё более способными и всё больше интегрируются в повседневные задачи: от помощи по дому до складской логистики и поддержки в здравоохранении.

Link to this sectionПроактивные системы наблюдения и безопасности#

Умные системы видеонаблюдения быстро внедряют искусственный интеллект для обнаружения необычной или небезопасной активности. С моделями обнаружения объектов камеры могут распознавать потенциальные проблемы в реальном времени и сразу оповещать команды безопасности, помогая улучшить как предотвращение, так и реагирование.

Например, на производственных объектах, где smartphone use ограничено по соображениям безопасности, ИИ-системы могут автоматически обнаруживать телефоны, как только они появляются, и отслеживать их перемещение с помощью YOLO и других vision-моделей. Это отражает более широкий тренд в безопасности, где vision AI используется для более проактивного мониторинга сред и более быстрого реагирования на потенциальные риски.

Помимо обнаружения, эти системы всё чаще комбинируются с другими технологиями для создания более комплексных решений безопасности. Edge-устройства позволяют обрабатывать отснятый материал локально, сокращая задержки и поддерживая надежность работы, а такие инструменты, как системы контроля доступа или распознавание лиц, могут добавить дополнительный уровень проверки. Вместе эти технологии работают над созданием более умных и взаимосвязанных сетей наблюдения, которые могут быстро и эффективно реагировать на ситуации в реальном мире.

Link to this sectionДополненная реальность и обнаружение объектов в повседневной жизни#

На оживленных складах и в крупных торговых залах работникам часто приходится управлять множеством задач одновременно. Дополненная реальность (AR) помогает в этом, размещая цифровые подсказки прямо в реальном мире. В сочетании с обнаружением объектов AR-системы могут идентифицировать товары, отслеживать их местоположение и отображать полезную информацию в реальном времени. Это делает повседневные задачи проще, быстрее и интуитивно понятнее для тех, кто их использует.

Растущим трендом в этой области является использование vision AI для превращения повседневных устройств в интеллектуальных помощников, способных понимать окружающую среду. По мере того как AR и обнаружение объектов продолжают сливаться, на рабочих местах начинают внедряться иммерсивные инструменты, поддерживающие голосовое управление и более эффективные рабочие процессы.

Хорошим примером являются AR-очки от Amazon с поддержкой ИИ, которые в настоящее время разрабатываются и тестируются. Эти очки используют обнаружение объектов и классификацию изображений для распознавания посылок, направления сотрудников по правильному маршруту и регистрации доказательств доставки. Это создает более безопасный опыт работы без участия рук, который помогает сотрудникам оставаться сосредоточенными и эффективными в течение дня.

Link to this sectionIoT-устройства для систем компьютерного зрения в реальном времени#

Смарт-устройства превратились в интеллектуальные системы, которые могут видеть, понимать и реагировать на свое окружение. Интернет вещей (IoT) стимулирует этот сдвиг, объединяя камеры, сенсоры, машины и приложения в сети, которые собирают и выполняют обработку данных в реальном времени.

Когда IoT работает вместе с обнаружением объектов и edge computing, устройства могут интерпретировать визуальную информацию, обнаруживать аномалии и мгновенно реагировать без участия человека. Это создает адаптивные и эффективные системы, которые управляют умными домами, промышленностью и целыми городами.

Например, недавнее исследование показало, как IoT-система для wildlife protection использует YOLOv8 для обнаружения животных, приближающихся к сельхозугодьям. После обнаружения система использует ИИ для принятия решений, чтобы задействовать мягкие сдерживающие факторы, такие как свет или звуки, безопасно отпугивая животных. Это помогает предотвратить повреждение посевов, поддерживая мирное сосуществование с местной фауной, что демонстрирует, как IoT и компьютерное зрение могут сделать сельское хозяйство более устойчивым.

Link to this sectionДругие интересные тренды в vision AI#

Помимо этих семи трендов, вот несколько примечательных разработок, формирующих будущее vision AI:

  • Исследования в области самообучения (self-supervised learning): Новые методы глубокого обучения позволяют моделям изучать полезные визуальные признаки из больших наборов неразмеченных изображений, помогая системам обнаружения объектов совершенствоваться без необходимости в больших объемах ручной разметки.
  • Рост обнаружения объектов на основе трансформеров: Трансформеры становятся всё более популярными, потому что они захватывают долгосрочные связи внутри изображений, давая моделям лучшее понимание контекста и улучшая точность обнаружения.
  • Интеграция LiDAR для более богатого 3D-восприятия: Сочетание LiDAR с обнаружением объектов на основе камер обеспечивает точную информацию о глубине, усиливая 3D-восприятие для таких задач, как навигация, робототехника и автономное вождение.

Link to this sectionОсновные выводы#

Обнаружение объектов вышло далеко за рамки базового распознавания изображений и теперь используется для обеспечения работы интеллектуальных систем, способных принимать решения в реальном времени. Заглядывая вперед, будущие модели, вероятно, достигнут ещё более высокой точности и более глубокого понимания контекста, позволяя vision AI стать ещё более надежным и универсальным в различных отраслях. По мере того как эти технологии продолжают развиваться, они будут формировать новое поколение более умных и адаптивных систем компьютерного зрения.

Хочешь узнать больше? Присоединяйся к нашему community и изучи GitHub repository, чтобы пообщаться с другими участниками в области ИИ. Посети наши страницы решений по AI in robotics и computer vision for agriculture, а также ознакомься с нашими вариантами licensing, чтобы начать работу с vision AI уже сегодня.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения