Узнайте, как ограничительные рамки определяют расположение объектов в компьютерном зрении. Изучите форматы координат, реальные приложения и способы использования Ultralytics .
Ограничительная рамка — это прямоугольная область, определяемая набором координат, которая охватывает конкретный объект в изображении или видеокадре. В области компьютерного зрения (CV) эти рамки служат основными аннотациями для обучения систем искусственного интеллекта (ИИ) тому, как находить и распознавать отдельные объекты. Вместо того, чтобы просто классифицировать все изображение как «содержащее автомобиль», ограничительная рамка позволяет модели точно определить местоположение и пространственные размеры автомобиля, отделяя его от фона и других объектов. Эта способность локализации имеет важное значение для задач обнаружения объектов, где цель состоит в том, чтобы одновременно идентифицировать несколько объектов с высокой точностью.
Для эффективной обработки визуальных данных модели машинного обучения (ML) используют специальные системы координат для математического представления ограничивающих прямоугольников. Выбранный формат часто определяет, как данные готовятся для обучения модели и как модель выдает свои прогнозы.
Ограничительные рамки являются строительными блоками для бесчисленных решений искусственного интеллекта в различных отраслях. Обеспечивая точную локализацию, они позволяют системам интеллектуально взаимодействовать с физическим миром.
При использовании современных архитектур, таких как YOLO26, модель
предсказывает граничные рамки вместе с меткой класса и
показатель доверия. Следующий пример демонстрирует, как
выполнить инференцию по изображению и получить доступ к координатам ограничительной рамки с помощью ultralytics пакет.
from ultralytics import YOLO
# Load the YOLO26 model
model = YOLO("yolo26n.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Access bounding box coordinates (xyxy format) for the first detected object
boxes = results[0].boxes
print(boxes.xyxy[0]) # Output: tensor([x1, y1, x2, y2, ...])
Хотя ограничительные рамки являются стандартом для общего обнаружения, они отличаются от других типов аннотаций, используемых в более детализированных задачах.
Создание высококачественных аннотаций ограничительных рамок является важным этапом в процессе машинного обучения. Ultralytics упрощает этот процесс, предлагая инструменты для аннотирования данных и управления наборами данных. Правильное аннотирование гарантирует, что модели научатся точно различать объекты, сводя к минимуму такие ошибки, как переобучение или путаница с фоном. Передовые методы, такие как немаксимальное подавление (NMS), используются во время вывода для уточнения этих прогнозов путем удаления перекрывающихся рамок, обеспечивая, чтобы для каждого объекта оставалось только самое точное обнаружение.
Начните свой путь в будущее машинного обучения