Узнайте о важной роли detection heads в обнаружении объектов, уточняющих карты признаков для точного определения местоположения и классов объектов.
Головка обнаружения действует как последний уровень принятия решений в архитектуре нейронной сети обнаружения объектов. В то время как более ранние уровни модели отвечают за понимание форм, текстур и особенностей изображения, головка обнаружения является специфическим компонентом, который интерпретирует эту информацию, чтобы точно предсказать, какие объекты присутствуют и где они находятся. Она преобразует абстрактные данные высокого уровня, полученные экстрактором признаков, в практические результаты, обычно выводя набор ограничительных рамок, охватывающих идентифицированные объекты, вместе с соответствующими им метками классов и оценками достоверности.
Чтобы полностью понять функцию детектирующей головки, полезно представить себе современные детекторы как состоящие из трех основных этапов, каждый из которых выполняет свою определенную функцию в конвейере компьютерного зрения (CV):
Конструкция детектирующих головок значительно эволюционировала для повышения скорости и точности, особенно с переходом от традиционных методов к современным моделям вывода в реальном времени.
Точность детектирующей головки имеет решающее значение для внедрения искусственного интеллекта (ИИ) в безопасных и промышленных средах. Пользователи могут легко аннотировать данные и обучать эти специализированные головки с помощью Ultralytics .
Следующий пример демонстрирует, как загрузить
YOLO26 модель и проверяет вывод ее детектирующей головки.
При выполнении инференции головка обрабатывает изображение и возвращает окончательный boxes содержащие координаты и
идентификаторы классов.
from ultralytics import YOLO
# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")
# Run inference on an image to utilize the detection head
results = model("https://ultralytics.com/images/bus.jpg")
# The detection head outputs are stored in results[0].boxes
for box in results[0].boxes:
# Print the bounding box coordinates and the predicted class
print(f"Class: {int(box.cls)}, Coordinates: {box.xywh.numpy()}")
Это взаимодействие подчеркивает, как детектирующая головка преобразует сложные активации нейронной сети в читаемые данные , которые разработчики могут использовать для последующих задач, таких как отслеживание или подсчет объектов.