Узнайте о роли backbones (основ) в глубоком обучении, изучите лучшие архитектуры, такие как ResNet & ViT, и узнайте об их реальных приложениях в AI.
Костяк - это основной компонент модели глубокого обучения, особенно в компьютерном зрении (КВ). Он функционирует как основной сети извлечения признаков, предназначенной для получения исходных данных, таких как изображение, и преобразования их в набор высокоуровневых характеристик. Эти Карты признаков отражают такие важные детали, как края, текстуры и формы. Это богатое представление затем используется последующими частями сети для выполнения таких задач, как обнаружение объектов, сегментация изображений или классификация изображений. Костяк - это основа нейронной сети (НС), которая учится "видеть" основные визуальные элементы в изображении.
Как правило, в качестве основы используется глубокая конволюционная нейронная сеть (CNN) которая была предварительно обучена на крупномасштабном наборе данных классификации, например ImageNet. Такое предварительное обучение, являющееся формой трансферного обучения, позволяет сети изучить обширную библиотеку общих визуальных признаков. При разработке модели для новой, специфической задачи разработчики часто используют предварительно обученную основу, вместо того чтобы начинать с нуля. Такой подход значительно сокращает время, необходимое для обучения пользовательских моделей и снижает требования к данным, что зачастую что зачастую приводит к повышению производительности. Признаки, извлеченные костяком, передаются в "шею" и "голове" сети, которые выполняют дальнейшую доработку и генерируют конечный результат. Выбор магистрали часто является компромиссом между точностью, размером модели и задержкой вывода, что является критическим фактором для достижения производительности в реальном времени.
Следующий код демонстрирует, как предварительно обученный Ultralytics YOLO11 модель, которая содержит эффективную основу, может быть загружена и использована для вывода на изображении.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model. Its architecture includes a powerful backbone.
model = YOLO("yolo11n.pt")
# Run inference. The backbone processes the image to extract features for detection.
results = model("https://ultralytics.com/images/bus.jpg")
# Display the detection results
results[0].show()
Конструкция магистральных сетей претерпела значительные изменения, и каждая новая архитектура обеспечивает повышение производительности и эффективности. эффективность. К числу наиболее влиятельных магистральных архитектур относятся:
В современных В современных архитектурах обнаружения объектов модель обычно разделяется на три основные части:
Таким образом, позвоночник - это фундаментальный строительный блок всей модели. Вы можете изучить различные Сравнение моделейYOLO , чтобы увидеть, как различные архитектурные решения влияют на производительность.
Магистрали являются важнейшими компонентами бесчисленных приложений искусственного интеллекта в различных отраслях: