Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024
Глоссарий

Семантическая сегментация

Откройте для себя возможности семантической сегментации — классифицируйте каждый пиксель на изображениях для точного понимания сцены. Изучите приложения и инструменты прямо сейчас!

Семантическая сегментация — это фундаментальная задача компьютерного зрения, которая включает в себя присвоение определенной метки класса каждому отдельному пикселю на изображении. В отличие от других методов, которые могут идентифицировать объекты с помощью ограничивающих прямоугольников или присваивать одну метку всему изображению, семантическая сегментация создает плотную, пиксельно-точную карту различных представленных семантических категорий. Это обеспечивает богатое, детальное понимание содержимого изображения, выделяя точную форму и местоположение каждой категории, такой как «дорога», «небо», «здание» или «человек». Это основная техника в сценах, где понимание контекста и макета так же важно, как и идентификация отдельных объектов.

Модели и инструменты

В семантической сегментации часто используются модели глубокого обучения, особенно архитектуры, основанные на сверточных нейронных сетях (CNN).

  • Архитектуры: Популярные ранние архитектуры включают полностью сверточные сети (FCN), которые заменили полносвязные слои в сетях классификации сверточными слоями для вывода пространственных карт, и U-Net, которая использует структуру энкодера-декодера с пропущенными соединениями, что делает ее особенно эффективной для анализа биомедицинских изображений. Другие влиятельные архитектуры включают DeepLab, которая использует атрозные (или расширенные) свертки для управления разрешением карт признаков.
  • Современные модели: Современные модели, такие как Ultralytics YOLO11, также предоставляют мощные возможности для различных задач сегментации, обеспечивая баланс между скоростью и точностью для приложений, требующих вывода в реальном времени.
  • Платформы для обучения: Такие инструменты, как Ultralytics HUB, предлагают платформы для управления наборами данных, такими как широко используемый набор данных COCO Segmentation, обучения пользовательских моделей и изучения вариантов развертывания моделей.
  • Фреймворки: Разработка часто использует популярные фреймворки, такие как PyTorch и TensorFlow. Такие методы, как аугментация данных, обычно используются для повышения устойчивости и обобщения модели. Библиотеки с открытым исходным кодом, такие как OpenCV и scikit-image, также предоставляют инструменты для обработки и анализа изображений, которые дополняют рабочие процессы сегментации.

Применение в реальном мире

Детальное понимание сцены, обеспечиваемое семантической сегментацией, имеет решающее значение во многих областях:

  • Автономные транспортные средства: Чтобы самоуправляемый автомобиль безопасно ориентировался, он должен полностью понимать свою среду. Семантическая сегментация используется для идентификации пригодных для вождения областей (дорога), непригодных для вождения областей (тротуары, здания) и местоположения пешеходов, велосипедистов и других транспортных средств с точностью до пикселя. Это обеспечивает более безопасное планирование маршрута и принятие решений. Вы можете узнать больше о роли ИИ в автономных транспортных средствах.
  • Анализ медицинских изображений: В медицине точность имеет первостепенное значение. Семантическая сегментация помогает автоматически выделять органы, опухоли, поражения и другие анатомические структуры на сканах, таких как МРТ и КТ. Это помогает рентгенологам в диагностике, планировании лечения и мониторинге прогрессирования заболевания. Узнайте больше о том, как ИИ применяется в медицинской визуализации.
  • Анализ спутниковых изображений: Для геопространственных приложений семантическая сегментация используется для классификации типов земного покрова на спутниковых снимках. Это можно использовать для городского планирования (определение зданий, дорог и зеленых зон), экологического мониторинга (отслеживание вырубки лесов или водных объектов) и точного земледелия.
  • Робототехника: Роботы используют семантическую сегментацию, чтобы понимать свою рабочую среду, позволяя им различать полы, стены, объекты для взаимодействия и препятствия, которые необходимо избегать. Это жизненно важно для навигации и манипулирования в сложных условиях, таких как склады или дома. Узнайте больше об интеграции компьютерного зрения в робототехнику.

Ключевые отличия от других задач

Важно отличать семантическую сегментацию от связанных задач компьютерного зрения:

  • Сегментация экземпляров: Это наиболее близкая задача. В то время как обе выполняют классификацию на уровне пикселей, сегментация экземпляров идет дальше, различая отдельные экземпляры одного и того же класса объектов. Например, на изображении с тремя автомобилями семантическая сегментация пометит все пиксели автомобилей просто как "автомобиль". В отличие от этого, сегментация экземпляров идентифицирует "автомобиль 1", "автомобиль 2" и "автомобиль 3" как отдельные объекты.
  • Детекция объектов: Эта задача определяет наличие и местоположение объектов на изображении, рисуя ограничивающую рамку вокруг каждого из них и присваивая метку класса. Она не предоставляет информацию о форме объекта или о том, какие пиксели ему принадлежат.
  • Паноптическая сегментация: Эту задачу можно рассматривать как объединение семантической сегментации и сегментации экземпляров. Она направлена на обеспечение всестороннего понимания сцены путем присвоения метки класса каждому пикселю (как семантическая сегментация), а также уникальной идентификации каждого экземпляра объекта (как сегментация экземпляров).

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас
Ссылка скопирована в буфер обмена