Image Segmentation
Изучи сегментацию изображений в компьютерном зрении. Узнай, как Ultralytics YOLO26 обеспечивает точные маски на уровне пикселей для экземплярной, семантической и паноптической сегментации.
Сегментация изображений — это сложный метод в компьютерном зрении (CV), который предполагает разделение цифрового изображения на несколько подгрупп пикселей, часто называемых сегментами изображения или областями. В отличие от стандартной классификации изображений, которая присваивает одну метку всему изображению, сегментация анализирует визуальные данные на гораздо более детальном уровне, присваивая определенную метку класса каждому отдельному пикселю. Этот процесс создает точную карту на уровне пикселей, позволяя моделям искусственного интеллекта (ИИ) понимать не только то, какие объекты присутствуют на изображении, но и где именно они расположены и каковы их точные границы.
Link to this sectionМеханика попиксельного анализа#
Для достижения такого высокого уровня детализации модели сегментации обычно используют архитектуры глубинного обучения (DL), в частности сверточные нейронные сети (CNN). Эти сети выступают в роли мощных экстракторов признаков, распознавая такие паттерны, как края, текстуры и сложные формы. Традиционные архитектуры сегментации, такие как классическая U-Net, часто используют структуру энкодера-декодера. Энкодер сжимает входное изображение для извлечения семантического контекста, а декодер восстанавливает пространственные детали для вывода финальной маски сегментации.
Современные достижения привели к созданию архитектур реального времени, таких как YOLO26, выпущенная в январе 2026 года. Эти модели интегрируют возможности сегментации непосредственно в сквозной конвейер, что обеспечивает высокоскоростную обработку на различном оборудовании, от облачных GPU до граничных устройств.
Link to this sectionОсновные типы сегментации#
В зависимости от конкретной цели проекта разработчики обычно выбирают один из трех основных методов сегментации:
- Семантическая сегментация: Этот метод классифицирует пиксели на основе их категории, но не различает отдельные объекты одного и того же класса. Например, при анализе спутниковых снимков все пиксели, представляющие «лес», будут окрашены в зеленый цвет, рассматривая весь лес как единое целое.
- Сегментация экземпляров: Этот метод идентифицирует и разделяет отдельные объекты интереса. В условиях оживленной улицы сегментация экземпляров создаст уникальную маску для «Машины А», «Машины Б» и «Пешехода А», позволяя системам подсчитывать и отслеживать конкретные сущности. Это ключевая функция семейства моделей Ultralytics YOLO26.
- Паноптическая сегментация: Гибридный подход, сочетающий охват семантической сегментации с точностью сегментации экземпляров. Он присваивает метку каждому пикселю, выделяя аморфные элементы фона (например, небо и дорогу) и одновременно уникально идентифицируя объекты переднего плана, поддающиеся счету.
Link to this sectionОтличие от обнаружения объектов#
Крайне важно отличать сегментацию от обнаружения объектов. Хотя алгоритмы обнаружения локализуют объекты с помощью прямоугольной ограничивающей рамки (BBox), они неизбежно включают пиксели фона внутрь этой рамки. Сегментация обеспечивает более точное представление, прослеживая контур или многоугольник объекта. Это различие жизненно важно для таких приложений, как роботизированный захват, где робот-манипулятор должен знать точную геометрию предмета, чтобы манипулировать им без столкновений.
Link to this sectionРеальные приложения#
Точность, обеспечиваемая сегментацией изображений, стимулирует инновации в самых разных отраслях:
- Медицинская диагностика: В области анализа медицинских изображений сегментация необходима для оконтуривания анатомических структур. Алгоритмы анализируют МРТ-снимки для определения границ опухолей или органов, что позволяет хирургам вычислять точные объемы и планировать процедуры с жизненно важной точностью.
- Автономное вождение: Самоуправляемые автомобили полагаются на сегментацию для безопасного передвижения. Обрабатывая видеопотоки, компьютер автомобиля может отличить проезжую часть от тротуаров и препятствий. Организации по стандартизации, такие как SAE International, определяют уровни автономности, которые требуют такого высокоточного восприятия окружающей среды.
- Точное земледелие: В ИИ в сельском хозяйстве сегментация помогает роботизированным системам выявлять сорняки среди сельскохозяйственных культур. Создавая маски для конкретных листьев растений, автоматизированные опрыскиватели могут воздействовать только на инвазивные виды, значительно сокращая использование гербицидов.
Link to this sectionРеализация сегментации с помощью YOLO26#
Разработчики могут эффективно реализовать сегментацию экземпляров с помощью пакета ultralytics для Python. В следующем примере используется современная модель YOLO26, оптимизированная как по скорости, так и по точности.
from ultralytics import YOLO
# Load a pre-trained YOLO26 segmentation model
# 'n' denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")
# Run inference on an image to generate masks
# The model identifies objects and outlines their shape
results = model("https://ultralytics.com/images/bus.jpg")
# Display the image with segmentation overlays
results[0].show()Для достижения высокой производительности в пользовательских задачах командам часто необходимо подготовить высококачественные обучающие данные. Платформа Ultralytics упрощает этот процесс, предоставляя инструменты для аннотирования изображений с помощью многоугольных масок, управления наборами данных и обучения моделей в облаке, что оптимизирует весь жизненный цикл MLOps. Библиотеки, такие как OpenCV, также часто используются вместе с этими моделями для предварительной обработки изображений и постобработки полученных масок.






