Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

U-Net

Откройте для себя U-Net, мощную архитектуру CNN для семантической сегментации. Узнайте о ее применении в медицинской, спутниковой и автономной визуализации.

U-Net - это специализированная архитектура для сверточных нейронных сетей (CNN) разработанная для выполнения точной классификации на уровне пикселей, известной как семантическая сегментация. В отличие от традиционных моделей классификации, которые присваивают единую метку всему изображению, U-Net предсказывает класс для U-Net предсказывает класс для каждого пикселя, создавая подробную карту, которая описывает точную форму и местоположение объектов. Первоначально разработанная для Изначально разработанная для анализа биомедицинских изображений, она стала основополагающей структурой в области компьютерного зрения (КВ) благодаря своей способности эффективно работать с ограниченными обучающие данные при этом получая результаты высокого разрешения.

U-образная архитектура

Название "U-Net" происходит от его симметричной, U-образной диаграммы, которая модифицирует стандартную автоэнкодер дизайн. Архитектура состоит из трех основных секций, которые совместно извлекают признаки и реконструируют изображение с подробными масками сегментации.

  • Контракторный путь (кодировщик): Левая часть "U" функционирует как обычный CNN костяк. Она применяет повторяющиеся свертка и операции объединения для постепенного уменьшения пространственных размеров изображения. Этот процесс, известный как понижающая дискретизацияувеличивает количество карты признаков на каждом слое, что позволяет модели изучать сложный, высокоуровневый контекст о том, "что" находится на изображении.
  • Расширяющийся путь (декодер): Правая часть архитектуры повторяет кодер, но выполняет обратную операцию. Он использует слои с повышающей конволюцией для увеличения разрешения функций до исходного входного размера. Это апсемплинг имеет решающее значение для распространения контекста на слои с более высоким разрешением, помогая сети понять, "где" находятся объекты расположены.
  • Skip Connections: Определяющим новшеством U-Net является использование пропускные соединения. Эти соединения объединяют карты признаков высокого разрешения из сужающегося контура непосредственно в соответствующие слои в расширяющемся контуре. Этот механизм сохраняет мелкозернистую пространственную информацию, которая обычно теряется при понижении дискретизации, что позволяет создавать четкие и точные границы.

Применение в реальном мире

U-Net была представлена в основополагающей статье "U-Net: Конволюционные сети для сегментации биомедицинских изображений". и с тех пор была адаптирована для многих отраслей промышленности, требующих точного локализации.

Анализ медицинских изображений

В здравоохранении точность имеет решающее значение. U-Net широко используется в анализ медицинских изображений для автоматизации обнаружения аномалий. Например, она помогает рентгенологам сегментировать опухоли на снимках МРТ или подсчитывать отдельные клетки на микроскопических изображениях. или подсчета отдельных клеток на микроскопических снимках, что способствует развитию ИИ в здравоохранении.

Геопространственный и спутниковый мониторинг

Архитектура также имеет большое значение для анализа спутниковых снимков. Модели U-Net могут segment типы почвенно-растительного покрова - различать водные, лесные и городские территории - для track для отслеживания обезлесения или мониторинга состояния сельскохозяйственных культур для умное сельское хозяйство.

Отличие от смежных терминов

Для понимания U-Net необходимо отличать ее от других задач по зрению:

  • U-Net против обнаружения объектов: Хотя обнаружение объектов модели определяют местоположение объекты с помощью прямоугольных ограничительные рамкиU-Net создает маску с идеальным пиксельным разрешением, которая точно повторяет контуры объекта.
  • U-Net против сегментации экземпляров: Стандартная U-Net выполняет семантическую сегментацию, рассматривая все объекты одного класса (например, все автомобили) как единый регион. В отличие от этого, сегментация экземпляров различает отдельные объекты одного класса. Современные архитектуры, такие как YOLO11 были разработаны для решения задач задачи обнаружения и сегментации с высокой эффективностью.

Современная сегментация с помощью Ultralytics

В то время как реализация сырой U-Net часто связана с написанием многословного кода в таких фреймворках, как PyTorch или TensorFlowно современные библиотеки упрощают этот процесс. Экосистема Ultralytics предлагает оптимизированные модели сегментации, которые использующие аналогичные архитектурные принципы для обеспечения производительности в реальном времени.

В следующем примере показано, как использовать предварительно обученный модель сегментацииYOLO11 для создания масок на уровне пикселей:

from ultralytics import YOLO

# Load a pre-trained YOLO11 segmentation model
model = YOLO("yolo11n-seg.pt")

# Run inference on an image to detect and segment objects
results = model("path/to/image.jpg")

# Display the results with segmentation masks overlaid
results[0].show()

Этот упрощенный рабочий процесс позволяет разработчикам интегрировать сложные возможности сегментации в приложения для развёртывание моделей на пограничных устройствах. При обучении этих моделей на пользовательских наборах данных, используя расширение данных настоятельно рекомендуется для предотвращения чрезмерной подгонкичто является распространенной проблемой при работе с точными аннотациями на уровне пикселей.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас