Откройте для себя возможности сегментации изображений с помощью Ultralytics YOLO. Изучите точность на уровне пикселей, типы, области применения и реальные примеры использования ИИ.
Сегментация изображений - это основная техника в Компьютерное зрение (КЗ) предполагает разбиение цифрового изображения на множество подгрупп пикселей, обычно называемых сегментами изображения. Основная цель заключается в том, чтобы упростить представление изображения, превратив его в нечто более осмысленное и удобное для анализа. В отличие от обнаружения объектов, которые локализуются в пределах прямоугольного ограничительного поля, сегментация изображения обеспечивает точную карту формы объекта на уровне пикселей. Этот процесс присваивает метку каждому пикселю изображения, что позволяет модели искусственного интеллекта (ИИ) понять точные границы и контуры объектов в сцене.
Во многих современных рабочих процессах машинного обучения (ML) недостаточно знать приблизительное местоположение объекта. Приложения, требующие взаимодействия с физическим миром - например, робот, захватывающий пакет, или автомобиль, движущийся по извилистой дороге, - требуют детального понимания геометрии. Сегментация изображений устраняет этот пробел, преобразуя необработанные визуальные данные в набор классифицированных областей. Этот сайт Эта возможность обеспечивается передовыми архитектуры глубокого обучения (ГОО), в частности Конволюционные нейронные сети (CNN), которые извлекают пространственные характеристики, чтобы отличить объекты переднего плана от фона.
Понимание конкретной задачи сегментации имеет решающее значение для выбора правильной архитектуры модели. Три основные категории:
Возможность очертить точные границы делает сегментацию незаменимой в различных отраслях:
Современные фреймворки упростили реализацию задач сегментации. В то время как старые двухэтапные детекторы, такие как Маска R-CNN были точными, но медленными, то одноэтапные модели произвели революцию в этой области, предложив вывод в реальном времени. Сайт Ultralytics YOLO11 например, поддерживает сегментацию экземпляров. Перспективы на будущее, YOLO26 разрабатывается для дальнейшей оптимизации этих возможности сквозной обработки.
Разработчики могут использовать стандартные библиотеки, такие как OpenCV для предварительной обработки и визуализации, при этом используя PyTorch на основе фреймворков PyTorch для вывода модели.
Вот краткий пример того, как выполнить сегментацию экземпляров с помощью предварительно обученной модели YOLO11 на языке Python:
from ultralytics import YOLO
# Load a pre-trained YOLO11 segmentation model
model = YOLO("yolo11n-seg.pt")
# Run inference on an image (can be a local path or URL)
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting image with segmentation masks overlaid
results[0].show()
Этот фрагмент кода автоматически решает сложные задачи извлечения признаков, регрессии ограничительных рамок и создания масок позволяя разработчикам сосредоточиться на интеграции интегрировать результаты сегментации в свои более крупные приложения.