Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Обнаружение объектов

Откройте для себя возможности обнаружения объектов - идентифицируйте и находите объекты на изображениях и видео с помощью передовых моделей, таких как YOLO. Изучите реальные приложения!

Обнаружение объектов является ключевой возможностью в компьютерного зрения (КВ), которая позволяет программным системам не только распознавать, что представляет собой изображение, но и находить на нем конкретные объекты. В то время как стандартная классификация присваивает единую метку всему визуальному вводу, обнаружение объектов обеспечивает более детальное понимание, предсказывая ограничивающую рамку вокруг каждого и сопровождаются меткой конкретного класса и оценка достоверности. Эта технология служит сенсорной основа для продвинутого искусственного интеллекта (ИИ), позволяя машинам воспринимать, интерпретировать и взаимодействовать со сложным физическим миром. От автоматизированного контроля качества От автоматизированного контроля качества на заводах до продвинутого видеонаблюдения, она преобразует неструктурированные пиксельные данные в действенные идеи.

Механика обнаружения объектов

Современные детекторы в основном опираются на архитектуры глубокого обучения (ГОО), в частности Конволюционные нейронные сети (КНС) для изучения пространственных иерархий признаков. Типичная архитектура состоит из опорной сети, такой как ResNet или CSPNet, которая извлекает основные визуальные признаки из входного изображения. Затем эти признаки обрабатываются головка обнаружения, которая выдает координаты для координаты ограничительных рамок и вероятность принадлежности к классу.

Для достижения высокой производительности модели обучаются на массивных коллекциях меток, таких как COCO dataset, которая является стандартом для бенчмаркинга. В процессе вывода, алгоритмы часто генерируют несколько перекрывающихся блоков для одного и того же объекта. Для этого используются такие методы, как Немаксимальное подавление (NMS) применяются для фильтрации этих избытков, сохраняя только бокс с наивысшим доверием и наилучшими характеристиками. Пересечение с объединением (IoU) с истиной.

Модели обычно делятся на два типа:

  • Двухэтапные детекторы объектов: Системы, подобные Faster R-CNN, сначала предлагают области интереса, а затем classify их. Несмотря на историческую точность, они могут быть вычислительно дорогими.
  • Одноступенчатые детекторы объектов: Современные архитектуры, включая Ultralytics YOLO11, предсказывают ограничительные рамки и вероятности классов за один проход. Этот подход оптимизирован для для выводов в реальном времени, обеспечивая идеальный баланс скорости и точности. Заглядывая в будущее, Ultralytics в настоящее время разрабатывает YOLO26, целью которой является дальнейшее совершенствование сквозной эффективности обнаружения эффективность.

Отличия от смежных задач резюме

Очень важно отличать обнаружение объектов от аналогичных задач компьютерного зрения.

  • Классификация изображений: Определяет , что находится на изображении (например, "собака"), но не определяет , где она находится и сколько их там.
  • Сегментация объектов: Как и обнаружение, определяет местоположение объектов, но вместо рамки создает маску с идеальным пиксельным разрешением, очерчивающую точную форму.
  • Отслеживание объектов: Это расширяет Обнаружение во временной области, присвоение уникального идентификатора обнаруженным объектам и отслеживание их траектории по всем видеокадрах.

Применение в реальном мире

Обнаружение объектов является движущей силой многих революционных технологий в различных отраслях.

  • Автономные системы: В автомобильной промышленности, Автономные транспортные средства используют модели обнаружения для идентификации пешеходов, дорожных знаков и других автомобилей за миллисекунды. Лидеры в этой области, такие как Waymo и Tesla Autopilot, полагаются на на эти возможности для безопасной навигации в сложных условиях.
  • Медицинская диагностика: На сайте ИИ в здравоохранении, модели обнаружения помогают радиологам, выделяя на рентгеновских снимках или компьютерных томограммах интересующие их области, например опухоли или переломы. Организации такие как Национальные институты здоровья (NIH), активно изучают возможности анализ медицинских изображений может уменьшить диагностических ошибок.
  • Аналитика в розничной торговле: Магазины используют ИИ в розничной торговле для автоматизации процессов оформления заказа и мониторинга товарных запасов. Системы, подобные Amazon Go, используют обнаружения для track того, какие товары покупатели берут с полок.

Пример реализации

Следующий фрагмент кода демонстрирует, как выполнить обнаружение объектов с помощью предварительно обученной модели YOLO11 с помощью ultralytics пакет. Этот простой рабочий процесс загружает модель и выполняет умозаключения на изображении для идентификации объектов, таких как автобусы и люди.

from ultralytics import YOLO

# Load a pretrained YOLO11 model (n-scale for speed)
model = YOLO("yolo11n.pt")

# Run inference on a remote image source
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results with bounding boxes and labels
results[0].show()

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас