Узнайте, как instance segmentation уточняет обнаружение объектов с точностью до пикселя, обеспечивая детальные маски объектов для приложений ИИ.
Сегментация объектов - это сложная техника компьютерного зрения (CV), которая идентифицирует, локализует и очерчивает отдельные объекты на изображении на уровне пикселей. В отличие от обнаружения объектов, которое приближенно определяет их местоположение объекта с помощью прямоугольного ограничительного поля, экземпляр сегментация генерирует точную маску, которая описывает точную форму каждого отдельного объекта. Такой уровень детализации позволяет системам различать несколько экземпляров одного и того же класса - например, отделять два пересекающихся автомобиля или отдельных людей в толпе. например, разделить два пересекающихся автомобиля или отдельных людей в толпе, что делает ее важнейшим компонентом передового искусственного интеллекта (ИИ) приложений.
Чтобы полностью понять сегментацию экземпляров, полезно сравнить ее с другими фундаментальными задачами задачами компьютерного зрения:
Сегментация экземпляров эффективно объединяет локализационные возможности обнаружения объектов с точностью до пикселя точностью семантической сегментации на уровне пикселей.
Модели сегментации экземпляров обычно используют архитектуры глубокого обучения (DL), в частности Конволюционные нейронные сети (CNN) для извлечения признаков из изображения. Этот процесс обычно включает два параллельных этапа:
В ранних подходах, таких как R-CNN Маска, использовался двухэтапный процесс, сначала генерирования предложений регионов, а затем их уточнения. Современные архитектуры, такие как Ultralytics YOLO11совершили революцию, выполнив обнаружения и сегментации на одном этапе. Это позволяет в режиме реального времени, что позволяет segment объекты в живых видеопотоках с высокой скоростью и точностью.
Точное определение границ, обеспечиваемое сегментацией экземпляров, незаменимо в различных отраслях промышленности:
Разработчики могут легко реализовать сегментацию экземпляров с помощью ultralytics Пакет Python . Библиотека
поддерживает YOLO11 модели, предварительно обученные на
Набор данных COCOкоторый способен detect и segment 80 распространенных категорий объектов.
из коробки.
Вот краткий пример того, как загрузить модель и выполнить сегментацию изображения:
from ultralytics import YOLO
# Load a pre-trained YOLO11 instance segmentation model
model = YOLO("yolo11n-seg.pt")
# Run inference on an image
# The model predicts classes, boxes, and masks simultaneously
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Visualize the results with masks plotted
results[0].show()
Для пользователей, желающих применить эту технологию к своим собственным данным, фреймворк поддерживает обучение на пользовательских наборах данных, что позволяет модели изучать новые классы, специфичные для конкретных приложений.