Обнаружение объектов
Откройте для себя возможности обнаружения объектов — идентифицируйте и находите объекты на изображениях или видео с помощью передовых моделей, таких как YOLO. Изучите реальные приложения!
Обнаружение объектов — это фундаментальная задача в компьютерном зрении (CV), которая включает в себя идентификацию и определение местоположения одного или нескольких объектов на изображении или видео. Цель состоит не только в том, чтобы классифицировать, что это за объекты, но и в том, чтобы определить их положение, как правило, путем рисования ограничивающей рамки вокруг каждого из них. Эта технология служит краеугольным камнем для многих передовых приложений искусственного интеллекта (ИИ), позволяя машинам воспринимать и интерпретировать свое физическое окружение с высокой степенью понимания.
Как работает обнаружение объектов
Модели обнаружения объектов обычно строятся с использованием глубокого обучения (DL), в частности сверточных нейронных сетей (CNN). Процесс включает в себя подачу изображения в сеть, которая затем выводит список обнаруженных объектов, каждый из которых имеет метку класса (например, «человек», «автомобиль», «собака»), оценку достоверности и координаты его ограничивающей рамки.
Современные архитектуры обнаружения объектов состоят из двух основных частей: основы для извлечения признаков из входного изображения и головки обнаружения для прогнозирования ограничивающих рамок и классов. Эти архитектуры часто классифицируются как одноступенчатые или двухступенчатые детекторы.
- Одноэтапные детекторы объектов: Модели, такие как семейство Ultralytics YOLO, выполняют обнаружение за один проход, что делает их очень быстрыми и подходящими для вывода в реальном времени. Они предсказывают все ограничивающие рамки и вероятности классов одновременно.
- Двухэтапные детекторы объектов: Архитектуры, такие как R-CNN и ее варианты, сначала предлагают области интереса, а затем классифицируют объекты в этих областях. Хотя они часто очень точны, они могут быть медленнее, чем одноэтапные детекторы.
Обнаружение объектов в сравнении с другими задачами CV
Важно отличать обнаружение объектов от других связанных задач компьютерного зрения:
Применение в реальном мире
Обнаружение объектов — это преобразующая технология, используемая во многих отраслях.
- Автономные транспортные средства: В самоуправляемых автомобилях обнаружение объектов имеет решающее значение для идентификации пешеходов, велосипедистов, других транспортных средств и сигналов светофора для безопасной навигации. Такие компании, как Waymo и Tesla, вложили значительные средства в эту технологию для обеспечения работы своих автономных систем.
- ИИ в производстве: На сборочных линиях модели обнаружения автоматически выявляют дефекты или проверяют правильность сборки компонентов. Это повышает контроль качества и повышает эффективность производства.
- Безопасность и наблюдение: Автоматизированные системы используют обнаружение объектов для идентификации несанкционированных лиц, оставленных пакетов или необычной активности в режиме реального времени, как подробно описано в нашем руководстве по созданию системы охранной сигнализации.
- ИИ в здравоохранении: В анализе медицинских изображений модели помогают рентгенологам, обнаруживая и выделяя аномалии, такие как опухоли или переломы, на рентгеновских снимках и компьютерных томограммах. Вы можете прочитать об использовании YOLO11 для обнаружения опухолей в нашем блоге.
- ИИ в сельском хозяйстве: Дроны и наземные роботы, оснащенные системой обнаружения объектов, могут отслеживать состояние посевов, выявлять вредителей и оценивать урожайность с высокой точностью.
Инструменты и обучение
Разработка и развертывание моделей обнаружения объектов включает в себя богатую экосистему инструментов и методов.
- Фреймворки: Популярные фреймворки глубокого обучения, такие как PyTorch и TensorFlow, предоставляют основные библиотеки для построения моделей.
- Модели: Ultralytics предоставляет современные модели, такие как YOLOv8 и YOLO11, которые оптимизированы для баланса между скоростью и точностью. Вы можете увидеть, как они соотносятся с другими моделями, на наших страницах сравнения моделей.
- Платформы: Ultralytics HUB упрощает весь рабочий процесс, от управления наборами данных, такими как популярный набор данных COCO, до обучения пользовательских моделей и облегчения развертывания моделей.
- Методы: Процесс обучения часто выигрывает от таких методов, как аугментация данных для повышения устойчивости и трансферное обучение для использования знаний из предварительно обученных моделей. Производительность модели оценивается с использованием таких метрик, как mAP и IoU, как объяснено в нашем руководстве по метрикам производительности.