Обнаружение объектов

Откройте для себя возможности обнаружения объектов - идентифицируйте и находите объекты на изображениях и видео с помощью передовых моделей, таких как YOLO. Изучите реальные приложения!

Обнаружение объектов - это фундаментальная задача компьютерного зрения (КВ), которая заключается в идентификации и определении местоположения одного или нескольких объектов на изображении или видео. Задача состоит не только в классификации объектов, но и в определении их местоположения, как правило, путем построения ограничительной рамки вокруг каждого из них. Эта технология служит краеугольным камнем для многих передовых приложений искусственного интеллекта (ИИ), позволяя машинам воспринимать и интерпретировать окружающую их физическую среду с высокой степенью понимания.

Как работает обнаружение объектов

Модели обнаружения объектов обычно строятся с использованием глубокого обучения (DL), в частности конволюционных нейронных сетей (CNN). Процесс заключается в подаче изображения в сеть, которая затем выдает список обнаруженных объектов, каждый из которых имеет метку класса (например, "человек", "автомобиль", "собака"), балл доверия и координаты его ограничительного поля.

Современные архитектуры обнаружения объектов состоят из двух основных частей: основы для извлечения признаков из входного изображения и головки обнаружения для предсказания граничных областей и классов. Эти архитектуры часто классифицируются как одноступенчатые или двухступенчатые детекторы.

Одноэтапные детекторы объектов: Модели, подобные семейству Ultralytics YOLO, выполняют обнаружение за один проход, что делает их очень быстрыми и пригодными для выводов в режиме реального времени. Они предсказывают все ограничительные рамки и вероятности классов одновременно.
Двухэтапные детекторы объектов: Архитектуры, подобные R-CNN и ее разновидностям, сначала предлагают области интереса, а затем классифицируют объекты в этих областях. Несмотря на высокую точность, они могут быть медленнее одноэтапных детекторов.

Обнаружение объектов по сравнению с другими задачами CV

Важно отличать обнаружение объектов от других связанных с компьютерным зрением задач:

Классификация изображений: Присваивает единую метку всему изображению (например, "это фотография кошки"). Она не определяет местоположение объекта.
Сегментация изображений: Классифицирует каждый пиксель в изображении, обеспечивая точное очертание объектов. Сегментация по экземплярам различает разные экземпляры одного и того же класса объектов, в то время как семантическая сегментация рассматривает все экземпляры класса как единое целое.
Отслеживание объектов: Расширение функции обнаружения объектов, которая позволяет отслеживать конкретный объект на нескольких кадрах видео, сохраняя его идентичность с течением времени. Подробнее об этом вы можете узнать из нашего руководства по отслеживанию движущихся объектов в видео.

Применение в реальном мире

Обнаружение объектов - это революционная технология, используемая во многих отраслях.

Автономные транспортные средства: В самоуправляемых автомобилях обнаружение объектов имеет решающее значение для идентификации пешеходов, велосипедистов, других транспортных средств и сигналов светофора для безопасной навигации. Такие компании, как Waymo и Tesla, вкладывают значительные средства в эту технологию для обеспечения работы своих автономных систем.
ИИ в производстве: На сборочных линиях модели обнаружения автоматически выявляют дефекты или проверяют правильность сборки компонентов. Это улучшает контроль качества и повышает эффективность производства.
Безопасность и наблюдение: Автоматизированные системы используют обнаружение объектов для выявления несанкционированных лиц, оставленных пакетов или необычных действий в режиме реального времени, как подробно описано в нашем руководстве по созданию системы охранной сигнализации.
ИИ в здравоохранении: При анализе медицинских изображений модели помогают рентгенологам обнаруживать и выделять аномалии, такие как опухоли или переломы, на рентгеновских снимках и компьютерных томограммах. Об использовании YOLO11 для обнаружения опухолей вы можете прочитать в нашем блоге.
ИИ в сельском хозяйстве: Дроны и наземные роботы, оснащенные системой обнаружения объектов, могут с высокой точностью отслеживать состояние посевов, выявлять вредителей и оценивать урожайность.

Инструменты и обучение

Разработка и развертывание моделей обнаружения объектов включает в себя богатую экосистему инструментов и методов.

Фреймворки: Популярные фреймворки глубокого обучения, такие как PyTorch и TensorFlow, предоставляют основные библиотеки для построения моделей.
Модели: Ultralytics предоставляет самые современные модели, такие как YOLOv8 и YOLO11, которые оптимизированы для баланса скорости и точности. Вы можете посмотреть, как они соотносятся с другими моделями, на наших страницах сравнения моделей.
Платформы: Ultralytics HUB упрощает весь рабочий процесс, от управления наборами данных, такими как популярный набор данных COCO, до обучения пользовательских моделей и облегчения развертывания моделей.
Методы: В процессе обучения часто используются такие методы, как увеличение объема данных для повышения надежности и трансферное обучение для использования знаний из предварительно обученных моделей. Производительность модели оценивается с помощью таких показателей, как mAP и IoU, как описано в нашем руководстве по показателям производительности.

Обнаружение объектов

Гибкое решение для корпоративного лицензирования, обеспечивающее инновации

Обучайте модели искусственного интеллекта за считанные секунды с помощью Ultralytics YOLO

Простое обучение моделям YOLO с помощью Ultralytics HUB

Как работает обнаружение объектов

Обнаружение объектов по сравнению с другими задачами CV

Применение в реальном мире

Инструменты и обучение

Подробнее в этой категории

Как изготавливается чай с использованием таких технологий, как Vision AI?

Передача Ultralytics YOLO11 на устройства Apple с помощью CoreML

Руководство по производственным ERP-системам

Присоединяйтесь к сообществу Ultralytics