Обнаружение объектов
Откройте для себя возможности обнаружения объектов - идентифицируйте и находите объекты на изображениях и видео с помощью передовых моделей, таких как YOLO. Изучите реальные приложения!
Обнаружение объектов - это фундаментальная задача компьютерного зрения (КВ), которая заключается в идентификации и определении местоположения одного или нескольких объектов на изображении или видео. Задача состоит не только в классификации объектов, но и в определении их местоположения, как правило, путем построения ограничительной рамки вокруг каждого из них. Эта технология служит краеугольным камнем для многих передовых приложений искусственного интеллекта (ИИ), позволяя машинам воспринимать и интерпретировать окружающую их физическую среду с высокой степенью понимания.
Как работает обнаружение объектов
Модели обнаружения объектов обычно строятся с использованием глубокого обучения (DL), в частности конволюционных нейронных сетей (CNN). Процесс заключается в подаче изображения в сеть, которая затем выдает список обнаруженных объектов, каждый из которых имеет метку класса (например, "человек", "автомобиль", "собака"), балл доверия и координаты его ограничительного поля.
Современные архитектуры обнаружения объектов состоят из двух основных частей: основы для извлечения признаков из входного изображения и головки обнаружения для предсказания граничных областей и классов. Эти архитектуры часто классифицируются как одноступенчатые или двухступенчатые детекторы.
Обнаружение объектов по сравнению с другими задачами CV
Важно отличать обнаружение объектов от других связанных с компьютерным зрением задач:
Применение в реальном мире
Обнаружение объектов - это революционная технология, используемая во многих отраслях.
- Автономные транспортные средства: В самоуправляемых автомобилях обнаружение объектов имеет решающее значение для идентификации пешеходов, велосипедистов, других транспортных средств и сигналов светофора для безопасной навигации. Такие компании, как Waymo и Tesla, вкладывают значительные средства в эту технологию для обеспечения работы своих автономных систем.
- ИИ в производстве: На сборочных линиях модели обнаружения автоматически выявляют дефекты или проверяют правильность сборки компонентов. Это улучшает контроль качества и повышает эффективность производства.
- Безопасность и наблюдение: Автоматизированные системы используют обнаружение объектов для выявления несанкционированных лиц, оставленных пакетов или необычных действий в режиме реального времени, как подробно описано в нашем руководстве по созданию системы охранной сигнализации.
- ИИ в здравоохранении: При анализе медицинских изображений модели помогают рентгенологам обнаруживать и выделять аномалии, такие как опухоли или переломы, на рентгеновских снимках и компьютерных томограммах. Об использовании YOLO11 для обнаружения опухолей вы можете прочитать в нашем блоге.
- ИИ в сельском хозяйстве: Дроны и наземные роботы, оснащенные системой обнаружения объектов, могут с высокой точностью отслеживать состояние посевов, выявлять вредителей и оценивать урожайность.
Инструменты и обучение
Разработка и развертывание моделей обнаружения объектов включает в себя богатую экосистему инструментов и методов.
- Фреймворки: Популярные фреймворки глубокого обучения, такие как PyTorch и TensorFlow, предоставляют основные библиотеки для построения моделей.
- Модели: Ultralytics предоставляет самые современные модели, такие как YOLOv8 и YOLO11, которые оптимизированы для баланса скорости и точности. Вы можете посмотреть, как они соотносятся с другими моделями, на наших страницах сравнения моделей.
- Платформы: Ultralytics HUB упрощает весь рабочий процесс, от управления наборами данных, такими как популярный набор данных COCO, до обучения пользовательских моделей и облегчения развертывания моделей.
- Методы: В процессе обучения часто используются такие методы, как увеличение объема данных для повышения надежности и трансферное обучение для использования знаний из предварительно обученных моделей. Производительность модели оценивается с помощью таких показателей, как mAP и IoU, как описано в нашем руководстве по показателям производительности.