Узнайте, как ограничивающие рамки позволяют системам обнаружения объектов, ИИ и машинного обучения. Изучите их роль в приложениях компьютерного зрения!
Ограничительная рамка — это прямоугольная область, определяемая набором координат, которая охватывает конкретный объект в изображении или видеокадре. В области компьютерного зрения (CV) эти рамки служат основными аннотациями для обучения систем искусственного интеллекта (ИИ) тому, как находить и распознавать отдельные объекты. Вместо того, чтобы просто классифицировать все изображение как «содержащее автомобиль», ограничительная рамка позволяет модели точно определить местоположение и пространственные размеры автомобиля, отделяя его от фона и других объектов. Эта способность локализации имеет важное значение для задач обнаружения объектов, где цель состоит в том, чтобы одновременно идентифицировать несколько объектов с высокой точностью.
Для эффективной обработки визуальных данных модели машинного обучения (ML) используют специальные системы координат для математического представления ограничивающих прямоугольников. Выбранный формат часто определяет, как данные готовятся для обучения модели и как модель выдает свои прогнозы.
Ограничительные рамки являются строительными блоками для бесчисленных решений искусственного интеллекта в различных отраслях. Обеспечивая точную локализацию, они позволяют системам интеллектуально взаимодействовать с физическим миром.
При использовании современных архитектур, таких как YOLO26, модель
предсказывает граничные рамки вместе с меткой класса и
показатель доверия. Следующий пример демонстрирует, как
выполнить инференцию по изображению и получить доступ к координатам ограничительной рамки с помощью ultralytics пакет.
from ultralytics import YOLO
# Load the YOLO26 model
model = YOLO("yolo26n.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Access bounding box coordinates (xyxy format) for the first detected object
boxes = results[0].boxes
print(boxes.xyxy[0]) # Output: tensor([x1, y1, x2, y2, ...])
Хотя ограничительные рамки являются стандартом для общего обнаружения, они отличаются от других типов аннотаций, используемых в более детализированных задачах.
Создание высококачественных аннотаций ограничительных рамок является важным этапом в процессе машинного обучения. Ultralytics упрощает этот процесс, предлагая инструменты для аннотирования данных и управления наборами данных. Правильное аннотирование гарантирует, что модели научатся точно различать объекты, сводя к минимуму такие ошибки, как переобучение или путаница с фоном. Передовые методы, такие как немаксимальное подавление (NMS), используются во время вывода для уточнения этих прогнозов путем удаления перекрывающихся рамок, обеспечивая, чтобы для каждого объекта оставалось только самое точное обнаружение.