Откройте для себя U-Net, мощную архитектуру CNN для семантической сегментации. Узнайте о ее применении в медицинской, спутниковой и автономной визуализации.
U-Net - это специализированная архитектура для сверточных нейронных сетей (CNN) разработанная для выполнения точной классификации на уровне пикселей, известной как семантическая сегментация. В отличие от традиционных моделей классификации, которые присваивают единую метку всему изображению, U-Net предсказывает класс для U-Net предсказывает класс для каждого пикселя, создавая подробную карту, которая описывает точную форму и местоположение объектов. Первоначально разработанная для Изначально разработанная для анализа биомедицинских изображений, она стала основополагающей структурой в области компьютерного зрения (КВ) благодаря своей способности эффективно работать с ограниченными обучающие данные при этом получая результаты высокого разрешения.
Название "U-Net" происходит от его симметричной, U-образной диаграммы, которая модифицирует стандартную автоэнкодер дизайн. Архитектура состоит из трех основных секций, которые совместно извлекают признаки и реконструируют изображение с подробными масками сегментации.
U-Net была представлена в основополагающей статье "U-Net: Конволюционные сети для сегментации биомедицинских изображений". и с тех пор была адаптирована для многих отраслей промышленности, требующих точного локализации.
В здравоохранении точность имеет решающее значение. U-Net широко используется в анализ медицинских изображений для автоматизации обнаружения аномалий. Например, она помогает рентгенологам сегментировать опухоли на снимках МРТ или подсчитывать отдельные клетки на микроскопических изображениях. или подсчета отдельных клеток на микроскопических снимках, что способствует развитию ИИ в здравоохранении.
Архитектура также имеет большое значение для анализа спутниковых снимков. Модели U-Net могут segment типы почвенно-растительного покрова - различать водные, лесные и городские территории - для track для отслеживания обезлесения или мониторинга состояния сельскохозяйственных культур для умное сельское хозяйство.
Для понимания U-Net необходимо отличать ее от других задач по зрению:
В то время как реализация сырой U-Net часто связана с написанием многословного кода в таких фреймворках, как PyTorch или TensorFlowно современные библиотеки упрощают этот процесс. Экосистема Ultralytics предлагает оптимизированные модели сегментации, которые использующие аналогичные архитектурные принципы для обеспечения производительности в реальном времени.
В следующем примере показано, как использовать предварительно обученный модель сегментацииYOLO11 для создания масок на уровне пикселей:
from ultralytics import YOLO
# Load a pre-trained YOLO11 segmentation model
model = YOLO("yolo11n-seg.pt")
# Run inference on an image to detect and segment objects
results = model("path/to/image.jpg")
# Display the results with segmentation masks overlaid
results[0].show()
Этот упрощенный рабочий процесс позволяет разработчикам интегрировать сложные возможности сегментации в приложения для развёртывание моделей на пограничных устройствах. При обучении этих моделей на пользовательских наборах данных, используя расширение данных настоятельно рекомендуется для предотвращения чрезмерной подгонкичто является распространенной проблемой при работе с точными аннотациями на уровне пикселей.