Глоссарий

Backbone (Опорная сеть)

Узнайте о роли backbones (основ) в глубоком обучении, изучите лучшие архитектуры, такие как ResNet & ViT, и узнайте об их реальных приложениях в AI.

Костяк - это основной компонент модели глубокого обучения, особенно в компьютерном зрении (КВ). Он функционирует как основной сети извлечения признаков, предназначенной для получения исходных данных, таких как изображение, и преобразования их в набор высокоуровневых характеристик. Эти Карты признаков отражают такие важные детали, как края, текстуры и формы. Это богатое представление затем используется последующими частями сети для выполнения таких задач, как обнаружение объектов, сегментация изображений или классификация изображений. Костяк - это основа нейронной сети (НС), которая учится "видеть" основные визуальные элементы в изображении.

Как работают Backbones

Как правило, в качестве основы используется глубокая конволюционная нейронная сеть (CNN) которая была предварительно обучена на крупномасштабном наборе данных классификации, например ImageNet. Такое предварительное обучение, являющееся формой трансферного обучения, позволяет сети изучить обширную библиотеку общих визуальных признаков. При разработке модели для новой, специфической задачи разработчики часто используют предварительно обученную основу, вместо того чтобы начинать с нуля. Такой подход значительно сокращает время, необходимое для обучения пользовательских моделей и снижает требования к данным, что зачастую что зачастую приводит к повышению производительности. Признаки, извлеченные костяком, передаются в "шею" и "голове" сети, которые выполняют дальнейшую доработку и генерируют конечный результат. Выбор магистрали часто является компромиссом между точностью, размером модели и задержкой вывода, что является критическим фактором для достижения производительности в реальном времени.

Следующий код демонстрирует, как предварительно обученный Ultralytics YOLO11 модель, которая содержит эффективную основу, может быть загружена и использована для вывода на изображении.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model. Its architecture includes a powerful backbone.
model = YOLO("yolo11n.pt")

# Run inference. The backbone processes the image to extract features for detection.
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detection results
results[0].show()

Общие архитектуры Backbones

Конструкция магистральных сетей претерпела значительные изменения, и каждая новая архитектура обеспечивает повышение производительности и эффективности. эффективность. К числу наиболее влиятельных магистральных архитектур относятся:

Остаточные сети (ResNet): Модели ResNet, представленные Microsoft Research, используют "пропускные связи", позволяющие обучать гораздо более глубокие сети за счет смягчения проблемы исчезающего градиента проблемы.
EfficientNet: Разработанное компанией Google AI, это семейство моделей использует метод комбинированного масштабирования, который равномерно балансирует глубину, ширину и разрешение сети для создания моделей, которые высокой точностью и эффективностью вычислений.
Vision Transformer (ViT): Эта архитектура адаптирует весьма успешную модель трансформера из обработки естественного языка (NLP) для задач зрения. ViT обрабатывают изображения как последовательности патчей и используют самовнимание для захвата глобального контекста. Отход от локальных рецептивных полей традиционных CNN.
CSPNet (Cross Stage Partial Network): Как подробно описано в В оригинальной статье эта архитектура повышает эффективность обучения за счет разделения карт признаков для уменьшения узких мест в вычислениях. Она является ключевым компонентом во многихYOLO Ultralytics YOLO моделей.

Backbone (основная часть сети) в сравнении с Head (головой) и Neck (шейкой)

В современных В современных архитектурах обнаружения объектов модель обычно разделяется на три основные части:

Основа: Роль основы заключается в извлечении из входного изображения карт признаков в различных масштабах. изображения.
Шея: Этот компонент соединяет позвоночник с головой. Он уточняет и агрегирует характеристики часто объединяя информацию из разных слоев для создания более богатого представления. Распространенным примером является сеть пирамид признаков (Feature Pyramid Network, FPN).
Головка обнаружения: Это конечная часть сети. Она получает уточненные признаки от шеи и выполняет основную задачу, такую как предсказание ограничивающие рамки, метки классов и баллы доверия для каждого объекта.

Таким образом, позвоночник - это фундаментальный строительный блок всей модели. Вы можете изучить различные Сравнение моделейYOLO , чтобы увидеть, как различные архитектурные решения влияют на производительность.

Применение в реальном мире

Магистрали являются важнейшими компонентами бесчисленных приложений искусственного интеллекта в различных отраслях:

Автономные транспортные средства: В В самоуправляемых автомобилях надежные магистрали, такие как ResNet или EfficientNet, обрабатывают изображения с камер для detect и classify других транспортных средств, пешеходов и сигналов светофора. Это извлечение признаков имеет решающее значение для навигации автомобиля и принятия решений, как показано в системах, разработанных такими компаниями, как WayNet. продемонстрировано в системах, разработанных такими компаниями, как Waymo.
Анализ медицинских изображений: В решениях ИИ для здравоохранения магистрали используются для анализа медицинских снимков, таких как рентгеновские и магнитно-резонансные томографы. Например, костяк может извлекать особенности из рентгеновского снимка грудной клетки, чтобы для выявления признаков пневмонии или из компьютерной томографии для поиска потенциальных опухолей, как показано в исследовании, проведенном в журнале Радиология: Artificial Intelligence. Это помогает радиологам ставить более быстрые и точные диагнозы, а модели, подобные YOLO11 , можно настраивать для решения специализированных задач, таких как обнаружение опухолей.

Backbone (Опорная сеть)

Обучение моделям Ultralytics YOLO для оптимизации рабочих процессов в разных отраслях

Гибкое корпоративное лицензирование для развития ваших инноваций

Обучайте модели искусственного интеллекта за считанные секунды с помощью Ultralytics YOLO

Как работают Backbones

Общие архитектуры Backbones

Backbone (основная часть сети) в сравнении с Head (головой) и Neck (шейкой)

Применение в реальном мире

Читать больше в этой категории

Понимание важности аннотации с участием человека

Что такое дистилляция наборов данных? Краткий обзор

Очки Oakley Meta AI переосмысливают концепцию очков с помощью Vision AI

Присоединяйтесь к сообществу Ultralytics