Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Object Detection Architectures

Исследуй архитектуры детектирования объектов, от бэкбонов до голов. Узнай, как Ultralytics YOLO26 обеспечивает элитную скорость и точность для компьютерного зрения в реальном времени.

Архитектуры обнаружения объектов — это структурные чертежи нейронных сетей, используемых для идентификации и локализации предметов внутри визуальных данных. В более широкой области computer vision (CV) эти архитектуры определяют, как машина "видит", преобразуя необработанные данные пикселей в значимые выводы. В отличие от базовых моделей классификации, которые просто присваивают метку изображению, архитектура обнаружения объектов разработана для выдачи bounding box вместе с меткой класса и confidence score для каждого отдельного объекта, который она находит. Этот структурный дизайн определяет скорость, точность и вычислительную эффективность модели, что делает его критическим фактором при выборе модели для real-time inference или высокоточного анализа.

Link to this sectionОсновные компоненты архитектуры#

Хотя конкретные конструкции различаются, большинство современных архитектур разделяют три фундаментальных компонента: backbone, neck и head. Backbone выступает в качестве основного экстрактора признаков. Обычно это Convolutional Neural Network (CNN), предварительно обученная на большом наборе данных, таком как ImageNet, отвечающая за идентификацию базовых форм, краев и текстур. Популярные варианты для backbone включают ResNet и CSPDarknet.

Neck соединяет backbone с финальными слоями вывода. Его роль заключается в смешивании и объединении признаков с разных этапов backbone, чтобы модель могла обнаруживать объекты разных размеров — концепция, известная как многомасштабная агрегация признаков (multi-scale feature fusion). Архитектуры часто используют здесь Feature Pyramid Network (FPN) или Path Aggregation Network (PANet), чтобы обогатить семантическую информацию, передаваемую слоям предсказания. Наконец, detection head обрабатывает эти объединенные признаки для предсказания конкретного класса и координат расположения каждого объекта.

Link to this sectionЭволюция: двухэтапные против одноэтапных#

Исторически архитектуры делились на две основные категории. Двухэтапные детекторы, такие как R-CNN family, сначала предлагают области интереса (RoIs), где могут существовать объекты, а затем классифицируют эти области на втором этапе. Хотя они, как правило, точны, они часто слишком вычислительно тяжелы для периферийных устройств.

Напротив, одноэтапные детекторы рассматривают обнаружение как простую задачу регрессии, отображая пиксели изображения напрямую в координаты bbox и вероятности классов за один проход. Этот подход, положенный в основу семейства YOLO (You Only Look Once), произвел революцию в индустрии, обеспечив производительность в реальном времени. Современные достижения привели к появлению таких моделей, как YOLO26, которые не только предлагают превосходную скорость, но и перешли на архитектуры типа end-to-end без использования NMS. Устранив необходимость в пост-обработке Non-Maximum Suppression (NMS), эти более новые архитектуры снижают вариативность задержки, что критически важно для систем, где важна безопасность.

Link to this sectionРеальные приложения#

Выбор архитектуры напрямую влияет на успех AI-решений в различных отраслях.

  • Автоматизация ритейла: В smart supermarkets эффективные одноэтапные архитектуры позволяют создавать автоматизированные системы оплаты, которые мгновенно распознают товары на конвейерной ленте или в тележке для покупок, сокращая время ожидания и количество ошибок, связанных с человеческим фактором.
  • Медицинская диагностика: Высокоточные архитектуры используются в medical image analysis для обнаружения аномалий, таких как опухоли на рентгеновских снимках или МРТ. Здесь способность архитектуры сохранять мелкозернистые детали важнее, чем чистая скорость обработки.

Link to this sectionРазграничение связанных терминов#

Важно отличать архитектуры обнаружения от схожих задач компьютерного зрения:

  • vs. Image Classification: Архитектура image classification (например, VGG или EfficientNet) присваивает одну метку всему изображению (например, "кошка"). Она не говорит тебе, где находится кошка или есть ли на изображении несколько кошек, что является основной функцией архитектур обнаружения.
  • vs. Instance Segmentation: В то время как обнаружение помещает объект в рамку, instance segmentation определяет точный, пиксельно-идеальный контур (маску) каждого объекта. Архитектуры сегментации часто являются расширениями архитектур обнаружения (например, добавление ветки маски к detection head).

Link to this sectionРеализация с помощью Ultralytics#

Современные фреймворки абстрагируют сложности этих архитектур, позволяя тебе использовать передовые разработки с минимальным количеством кода. Используя пакет ultralytics, ты можешь загрузить предварительно обученную модель YOLO26 и сразу запустить инференс. Для команд, которые ищут способ управления своими наборами данных и обучения пользовательских архитектур в облаке, Ultralytics Platform упрощает весь конвейер MLOps.

from ultralytics import YOLO

# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Run inference on an image source
# This uses the model's architecture to detect objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения