Откройте для себя возможности обнаружения объектов - идентифицируйте и находите объекты на изображениях и видео с помощью передовых моделей, таких как YOLO. Изучите реальные приложения!
Обнаружение объектов является ключевой возможностью в компьютерного зрения (КВ), которая позволяет программным системам не только распознавать, что представляет собой изображение, но и находить на нем конкретные объекты. В то время как стандартная классификация присваивает единую метку всему визуальному вводу, обнаружение объектов обеспечивает более детальное понимание, предсказывая ограничивающую рамку вокруг каждого и сопровождаются меткой конкретного класса и оценка достоверности. Эта технология служит сенсорной основа для продвинутого искусственного интеллекта (ИИ), позволяя машинам воспринимать, интерпретировать и взаимодействовать со сложным физическим миром. От автоматизированного контроля качества От автоматизированного контроля качества на заводах до продвинутого видеонаблюдения, она преобразует неструктурированные пиксельные данные в действенные идеи.
Современные детекторы в основном опираются на архитектуры глубокого обучения (ГОО), в частности Конволюционные нейронные сети (КНС) для изучения пространственных иерархий признаков. Типичная архитектура состоит из опорной сети, такой как ResNet или CSPNet, которая извлекает основные визуальные признаки из входного изображения. Затем эти признаки обрабатываются головка обнаружения, которая выдает координаты для координаты ограничительных рамок и вероятность принадлежности к классу.
Для достижения высокой производительности модели обучаются на массивных коллекциях меток, таких как COCO dataset, которая является стандартом для бенчмаркинга. В процессе вывода, алгоритмы часто генерируют несколько перекрывающихся блоков для одного и того же объекта. Для этого используются такие методы, как Немаксимальное подавление (NMS) применяются для фильтрации этих избытков, сохраняя только бокс с наивысшим доверием и наилучшими характеристиками. Пересечение с объединением (IoU) с истиной.
Модели обычно делятся на два типа:
Очень важно отличать обнаружение объектов от аналогичных задач компьютерного зрения.
Обнаружение объектов является движущей силой многих революционных технологий в различных отраслях.
Следующий фрагмент кода демонстрирует, как выполнить обнаружение объектов с помощью предварительно обученной модели YOLO11 с помощью
ultralytics пакет. Этот простой рабочий процесс загружает модель и выполняет умозаключения на изображении для идентификации
объектов, таких как автобусы и люди.
from ultralytics import YOLO
# Load a pretrained YOLO11 model (n-scale for speed)
model = YOLO("yolo11n.pt")
# Run inference on a remote image source
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results with bounding boxes and labels
results[0].show()