Обнаружение границ в обработке изображений: объяснение

Как люди, мы естественным образом распознаем края объектов, следим за их кривыми и замечаем текстуры на их поверхностях, когда смотрим на изображение. Однако для компьютера понимание начинается на уровне отдельных пикселей.

Пиксель, самая маленькая единица цифрового изображения, сохраняет цвет и яркость в одной точке. Отслеживая изменения значений пикселей в изображении, компьютер может detect закономерности, раскрывающие ключевые детали.

В частности, обработка изображений использует данные пикселей, чтобы выделить важные признаки и удалить отвлекающие факторы. Одним из распространенных методов обработки изображений является обнаружение краев, которое определяет точки, где яркость или цвет резко меняются, чтобы очертить объекты, отметить границы и добавить структуру.

Это позволяет компьютерам разделять формы, измерять размеры и интерпретировать, как соединяются части сцены. Обнаружение краев часто является первым шагом в расширенном анализе изображений.

Рис. 1. Пример, показывающий исходное изображение наряду с результатами различных методов обнаружения краев. (Источник)

‍

В этой статье мы рассмотрим, что такое обнаружение границ, как оно работает и каковы его реальные применения. Начнем!

Концепции обнаружения границ

Обнаружение границ фокусируется на поиске мест на изображении, где яркость или цвет заметно меняются от одной точки к другой. Если изменение небольшое, область кажется гладкой. Если изменение резкое, оно часто отмечает границу между двумя разными областями.

Вот некоторые из причин, по которым происходят эти изменения пикселей:

Разрывы нормалей поверхности: Когда две поверхности встречаются под углом, например, угол стены или край коробки, это резкое изменение ориентации создает четкую границу на изображении.
‍
Разрывы глубины: Они появляются там, где объекты находятся на разном расстоянии от камеры, создавая видимое разделение, которое помогает системе различать их.
‍
Изменения цвета или текстуры поверхности: Это происходит, когда одна область имеет другой цвет или текстуру, чем соседняя область, создавая видимое разделение.
‍
Изменения освещения: Это возникает из-за изменений освещения, включая тени или блики на поверхностях, создавая видимые разделения, даже если сами поверхности гладкие или непрерывные.

Рис. 2. Различные типы разрывов краев на изображениях. (Источник)

‍

Как работает распознавание границ объектов

Обнаружение границ обычно начинается с преобразования цветного изображения в оттенки серого, поэтому каждая точка показывает только яркость. Это упрощает алгоритму задачу сосредоточиться на различиях света и тени, а не на цвете.

Далее специальные фильтры могут сканировать изображение для поиска мест, где яркость резко меняется. Эти фильтры вычисляют, насколько круто меняется яркость, это называется градиентом. Более высокий градиент вызван большей разницей между близлежащими точками, что часто сигнализирует о крае.

Затем алгоритм продолжает уточнять изображение, удаляя мелкие детали и сохраняя только самые важные линии и формы. Результатом является четкий контур и выходное изображение, которое можно использовать для дальнейшего анализа.

Эволюция обнаружения краев и обработки изображений

Прежде чем мы углубимся в обнаружение границ более подробно, давайте обсудим, как оно развивалось с течением времени.

Обработка изображений началась с простых, основанных на правилах методов, таких как пороговая обработка и фильтрация для очистки и улучшения изображений. В аналоговую эпоху это означало работу с фотографиями или пленкой с использованием оптических фильтров, увеличительных стекол или химической обработки для выявления деталей.

Такие методы, как регулировка контрастности, шумоподавление, регулировка интенсивности изображения и базовое обнаружение краев, помогли сделать входные изображения более четкими и выделить формы и текстуры. В 1960-х и 70-х годах переход от аналоговой к цифровой обработке открыл путь для современного анализа в таких областях, как астрономия, медицинская визуализация и спутниковый мониторинг.

К 1980-м и 90-м годам более быстрые компьютеры позволили решать более сложные задачи, такие как извлечение признаков, обнаружение форм и базовое распознавание объектов. Алгоритмы, такие как оператор Собеля и Канни, предложили более точное обнаружение краев, а распознавание образов нашло применение во всем, от промышленной автоматизации до чтения печатного текста с помощью оптического распознавания символов.

Обнаружение границ и компьютерное зрение в 21 веке

Сегодня устойчивый прогресс в технологиях привел к развитию компьютерного зрения. Vision AI, или компьютерное зрение, — это раздел ИИ, который фокусируется на обучении машин интерпретировать и понимать визуальную информацию.

В то время как традиционная обработка изображений, такая как двойная пороговая обработка (которая делает изображения более четкими, сохраняя сильные края и удаляя слабые) и обнаружение краев, следовала фиксированным правилам и могла справляться только с конкретными задачами, компьютерное зрение использует модели, управляемые данными, которые могут учиться на примерах и адаптироваться к новым ситуациям.

Сегодня системы визуализации выходят далеко за рамки простого улучшения изображений или обнаружения краев. Они могут распознавать объекты, track движение и понимать контекст всей сцены.

Одним из ключевых методов, который делает это возможным, является свертка. Операция свертки — это процесс, при котором небольшие фильтры (также называемые ядрами) сканируют изображение для поиска важных закономерностей, таких как края, углы и текстуры. Эти закономерности становятся строительными блоками, которые модели компьютерного зрения используют для распознавания и понимания объектов.

Например, модели компьютерного зрения, такие как Ultralytics YOLO11 используют эти функции на основе свертки для выполнения таких сложных задач, как сегментация объектов. Это тесно связано с обнаружением краев, поскольку сегментация объектов требует точного определения границ каждого объекта на изображении.

В то время как обнаружение краев сосредоточено на поиске изменений интенсивности в пикселях краев для обозначения краев объекта, сегментация экземпляров основывается на этой идее для detect краев, classify и выделения каждого объекта в отдельный регион.

Рис. 3. Обзор использования YOLO11 и сегментации экземпляров.(Источник)

‍

Алгоритмы и подходы обнаружения границ

Даже с ростом компьютерного зрения обработка изображений по-прежнему является важной частью многих приложений. Это потому, что компьютерное зрение часто строится на основных этапах предварительной обработки изображений.

Прежде чем обнаруживать объекты или понимать сцену, системы обычно очищают изображение, уменьшают шум и находят края, чтобы выделить ключевые детали. Эти шаги делают продвинутые модели более точными и эффективными.

Далее мы рассмотрим некоторые из наиболее распространенных алгоритмов обработки изображений, используемых для detect краев, и принцип их работы.

Обнаружение границ методом Собеля

Обнаружение границ методом Собеля — это ключевой метод, используемый для поиска контуров объектов на изображении. Вместо того чтобы анализировать каждую деталь сразу, он фокусируется на областях, где яркость резко меняется от одного пикселя к следующему соседнему пикселю.

Эти внезапные сдвиги обычно отмечают точку, где один объект заканчивается и начинается другой, или где объект встречается с фоном. Изолируя эти края, Sobel преобразует сложное изображение в более чистый контур, который другим системам легче обрабатывать для таких задач, как отслеживание движения, обнаружение форм или распознавание объектов.

Обнаружение границ по методу Собеля можно рассматривать как детектор градиента, который измеряет, как изменяется интенсивность по изображению. По сути, это работает посредством операции свертки: скольжения небольших матриц, называемых ядрами, по изображению и вычисления взвешенных сумм значений соседних пикселей.

Эти ядра предназначены для выделения изменений яркости по горизонтальному и вертикальному направлениям. В отличие от моделей глубокого обучения, где ядра изучаются на основе данных, Sobel использует фиксированные ядра для эффективного выделения краев без необходимости обучения.

Вот более подробный обзор того, как работает метод обнаружения границ Собеля:

Использование двух фильтров 3×3: Этот метод использует две крошечные сетки 3×3, называемые фильтрами. Представьте их как трафареты, которые скользят по изображению в горизонтальном (направление x) и вертикальном направлениях (направление y). Одна сетка предназначена для поиска горизонтальных краев, а другая - для вертикальных краев.
Вычисление градиента: Каждый фильтр определяет, как быстро меняется яркость, и направление градиента. Большое изменение означает возможный край.
Объединение результатов: Горизонтальные и вертикальные результаты объединяются для определения общей силы и направления края в каждом пикселе.
Обнаружение краев: Пиксели с высокой величиной градиента помечаются как сильные края.
Очерчивание границ: Эти края помогают определить формы объектов и отделить разные области на изображении.

Рис. 4. Детектор границ Собеля может выделить основные контуры входного изображения и создать карту границ. (Источник)

‍

Обнаружение границ Канни

Обнаружение границ Канни — еще один популярный метод поиска границ на изображении. Он известен тем, что создает четкие и точные контуры. В отличие от основных методов обнаружения границ, он выполняет ряд тщательно разработанных шагов для фильтрации шума, повышения резкости границ и фокусировки на наиболее важных краях.

Вот краткий обзор того, как работает детектор границ Канни:

Сглаживание изображения: Сначала изображение размывается с помощью фильтра Гаусса, техники сглаживания, которая уменьшает шум и мелкие детали, которые можно ошибочно принять за края.
‍
Обнаружение изменений яркости: Затем алгоритм сканирует резкие изменения яркости, используя вычисления градиента для измерения силы и направления этих изменений.
Утончение краев: Сохраняются только самые сильные точки вдоль каждой обнаруженной линии, а более слабые точки удаляются, в результате чего получаются четкие, чистые края.
Классификация краев: Каждый пиксель помечается как сильный, слабый или не являющийся краем, на основе пороговых значений изменения яркости.
Финальная очистка: Слабые края, соединенные с сильными, сохраняются; все остальные отбрасываются, оставляя только четкие, связанные границы.

Рис. 5. Исходное изображение и соответствующее выходное изображение после использования детектора границ Канни. (Источник)

‍

Благодаря тому, что алгоритм выделения границ Канни обеспечивает точные результаты, отфильтровывая шум, он широко используется в областях, где важна точность. Например, он используется в таких отраслях, как медицинская визуализация, спутниковое картирование, сканирование документов и машинное зрение.

Обнаружение краев на основе градиента в сравнении с обнаружением на основе Гаусса

На данный момент два рассмотренных нами примера обнаружения границ — это Sobel и Canny. Хотя оба направлены на поиск границ, они по-разному подходят к решению этой задачи.

Градиентные методы (такие как Sobel, Prewitt и Scharr) detect края, ища резкие изменения яркости, известные как градиент. Они сканируют изображение и отмечают места, где это изменение сильнее всего. Эти методы просты, быстры и хорошо работают, когда изображения четкие. Однако они чувствительны к шуму - крошечные изменения яркости могут быть приняты за края.

Методы на основе гауссианы (такие как Canny или лапласиан гауссианы) добавляют дополнительный шаг для решения этой проблемы: сначала размывают изображение. Это сглаживание, часто выполняемое с помощью фильтра Гаусса, уменьшает небольшие вариации, которые могут создать ложные края. После сглаживания эти методы по-прежнему ищут резкие изменения яркости, но результаты получаются более чистыми и точными для зашумленных или некачественных изображений.

Рис. 6. Обнаружение границ на основе градиента и на основе гауссиана. Изображение автора.

‍

Реальные приложения обнаружения краев

Теперь, когда мы лучше понимаем, как работает обнаружение границ, давайте рассмотрим, как оно применяется в реальных ситуациях.

Использование обнаружения границ для выявления трещин

Инспекция крупных бетонных конструкций, таких как мосты и высотные здания, часто является сложной и опасной задачей. Эти конструкции могут простираться на большие расстояния или достигать большой высоты, что делает традиционные проверки медленными, дорогостоящими и рискованными. Такие проверки обычно требуют использования строительных лесов, канатных дорог, ручных измерений с близкого расстояния или фотосъемки.

Интересный подход был изучен в 2019 году, когда исследователи протестировали более безопасный и быстрый метод с использованием дронов, оснащенных камерами высокого разрешения, для получения подробных входных изображений бетонных поверхностей. Затем эти изображения были обработаны с использованием различных методов обнаружения краев для автоматического выявления трещин.

Исследование показало, что этот метод значительно снизил необходимость прямого доступа людей к опасным зонам и ускорил проверки. Однако его точность по-прежнему зависела от таких факторов, как условия освещения, четкость изображения и стабильная работа дрона. В некоторых случаях все еще требовалась проверка человеком для устранения ложных срабатываний.

Применение обнаружения границ в медицинской визуализации

Рентгеновские снимки и МРТ часто содержат визуальные помехи, известные как шум, которые могут затруднить разглядывание мелких деталей. Это создает проблему для врачей, пытающихся определить границы опухоли, проследить контур органа или отслеживать незначительные изменения с течением времени.

В недавнем исследовании медицинской визуализации проверялось, насколько хорошо распространенные методы обнаружения краев, такие как Sobel, Canny, Prewitt и Laplacian, справляются с зашумленными изображениями. Исследователи добавляли различные типы и уровни шума к изображениям и проверяли, насколько точно каждый метод может выделить важные особенности.

Канни обычно выдавал самые четкие края, даже при сильном шуме, но он не был лучшим в каждом случае. Некоторые методы работали лучше с определенными типами шума, поэтому не существует единого идеального решения.

Рис. 7. Canny (d–f) обеспечивает более четкие края, чем Sobel (g–i), по мере увеличения шума. (Источник)

‍

Это подчеркивает, почему такие технологии, как компьютерное зрение, так важны. Благодаря сочетанию передовых алгоритмов и моделей Vision AI, такие решения могут выходить за рамки простого обнаружения краев, обеспечивая более точные и надежные результаты даже в сложных условиях.

Преимущества обнаружения границ

Вот некоторые преимущества использования обнаружения границ и обработки изображений:

Улучшенное сжатие данных: Обнаружение границ позволяет представлять изображения, используя только ключевые признаки, уменьшая размер файла при сохранении важной информации. Это делает хранение и передачу более эффективными.
Более точная локализация объектов: Благодаря точному определению границ объекта обнаружение краев улучшает способность систем определять местоположение и track объекты, что благоприятно сказывается на таких приложениях, как Vision AI в робототехнике и автономных транспортных средствах.
Многомасштабное обнаружение признаков: Методы обнаружения краев могут анализировать изображения в разных масштабах, захватывая как мелкие детали, так и более крупные формы. Эта гибкость полезна в различных задачах, от анализа текстур до понимания сцен.

Ограничения использования обработки изображений для обнаружения краев

Хотя обнаружение краев имеет много преимуществ при обработке изображений, оно также сопряжено с некоторыми проблемами. Вот некоторые из ключевых ограничений, которые следует учитывать:

Проблемы со сложными текстурами: На изображениях со сложными или повторяющимися узорами обнаружение краев часто приводит к появлению множества ложных или нерелевантных краев, что усложняет дальнейший анализ и снижает надежность.
Чувствительность к освещению: Изменения яркости, тени и отражения могут привести к тому, что детекторы границ неверно интерпретируют изменения освещения как границы объектов, что приведет к непоследовательным результатам.
Нет идентификации объектов: Хотя края выделяют начало и конец объектов, они не показывают, что это за объекты. Необходима дополнительная обработка, чтобы присвоить значение или метки обнаруженным краям.

Когда компьютерное зрение может быть использовано для обнаружения краев

Обнаружение границ основано на том, как наши глаза и мозг работают вместе, чтобы осмыслить мир. В человеческом зрении специализированные нейроны в зрительной коре очень чувствительны к краям, линиям и границам.

Эти визуальные подсказки помогают нам быстро определить, где один объект заканчивается и начинается другой. Вот почему даже простой линейный рисунок может быть мгновенно узнаваем — наш мозг в значительной степени полагается на края для идентификации форм и объектов.

Компьютерное зрение стремится имитировать эту способность, но при этом делает шаг вперед. Такие модели, как Ultralytics YOLO11 , выходят за рамки базового выделения краев и улучшения изображения. Они могут detect объекты, точно очерчивать их контуры и track движение в режиме реального времени. Такой глубокий уровень понимания делает их незаменимыми в сценариях, где одного обнаружения краев недостаточно.

Использование Ultralytics YOLO11 для более точного detect краев

Вот некоторые ключевые задачи компьютерного зрения, поддерживаемые YOLO11 , которые основываются на распознавании краев и выходят за их пределы:

Детекция объектов: Она идентифицирует и определяет местоположение нескольких объектов на изображении или видео, рисуя ограничивающие рамки вокруг каждого из них, предоставляя четкое представление о том, что присутствует и где расположен каждый объект.
Сегментация экземпляров: предполагает разбивку объектов до уровня пикселей, создавая четкие и точные контуры, даже когда объекты перекрываются или имеют неправильную форму.
Оценка позы: Цель здесь - определить положение, ориентацию или позу объекта или человека, что помогает в мониторинге движения или обнаружении структурных изменений с течением времени.
Отслеживание объектов: Эта задача отслеживает объект по мере его перемещения по видеокадрам, обеспечивая согласованную идентификацию для точного долгосрочного наблюдения.
Классификация изображений: Она присваивает метки объектам или целым изображениям на основе их визуальных характеристик, что упрощает организацию и интерпретацию больших наборов данных.

Обнаружение краев в инфраструктуре с помощью компьютерного зрения

Хорошим примером использования компьютерного зрения в приложениях, которые традиционно полагались на обнаружение краев, является обнаружение трещин в инфраструктуре и промышленных объектах. Модели компьютерного зрения, подобные YOLO11 , могут быть обучены точному выявлению трещин на дорогах, мостах и трубопроводах. Эта же техника может применяться при обслуживании самолетов, осмотре зданий и контроле качества продукции, помогая ускорить проверки и повысить безопасность.

Рис. 8. Пример использования YOLO11 для сегментации трещин.(Источник)

‍

Основные выводы

Обнаружение границ прошло долгий путь, от простых ранних методов до передовых техник, которые могут обнаружить даже тонкие границы в сложных изображениях. Это помогает выявить важные детали, выделить ключевые области и подготовить изображения для более глубокого анализа, что делает его основной частью обработки изображений.

В компьютерном зрении обнаружение границ играет важную роль в определении форм, разделении объектов и извлечении полезной информации. Оно используется во многих областях, таких как медицинская визуализация, промышленные инспекции, автономное вождение и безопасность, для обеспечения точного и надежного визуального понимания.

Присоединяйтесь к нашему сообществу и изучите наш репозиторий GitHub, чтобы узнать больше об ИИ. Если вы хотите начать свой собственный проект Vision AI, ознакомьтесь с нашими вариантами лицензирования. Узнайте больше о таких приложениях, как ИИ в здравоохранении и Vision AI в розничной торговле, посетив страницы наших решений.

‍

Понимание обнаружения границ в обработке изображений

Концепции обнаружения границ

Как работает распознавание границ объектов

Эволюция обнаружения краев и обработки изображений

Обнаружение границ и компьютерное зрение в 21 веке

Алгоритмы и подходы обнаружения границ

Обнаружение границ методом Собеля

Обнаружение границ Канни

Обнаружение краев на основе градиента в сравнении с обнаружением на основе Гаусса

Реальные приложения обнаружения краев

Использование обнаружения границ для выявления трещин

Применение обнаружения границ в медицинской визуализации

Преимущества обнаружения границ

Ограничения использования обработки изображений для обнаружения краев

Когда компьютерное зрение может быть использовано для обнаружения краев

Использование Ultralytics YOLO11 для более точного detect краев

Обнаружение краев в инфраструктуре с помощью компьютерного зрения

Основные выводы

Читать больше в этой категории

Что такое сопоставление изображений в Vision AI? Краткое введение

Введение в развивающуюся область нейросимволического ИИ

От битов к кубитам: Как квантовая оптимизация меняет ИИ

Давайте строить будущее
ИИ вместе!

Понимание обнаружения границ в обработке изображений

Концепции обнаружения границ

Как работает распознавание границ объектов

Эволюция обнаружения краев и обработки изображений

Обнаружение границ и компьютерное зрение в 21 веке

Алгоритмы и подходы обнаружения границ

Обнаружение границ методом Собеля

Обнаружение границ Канни

Обнаружение краев на основе градиента в сравнении с обнаружением на основе Гаусса

Реальные приложения обнаружения краев

Использование обнаружения границ для выявления трещин

Применение обнаружения границ в медицинской визуализации

Преимущества обнаружения границ

Ограничения использования обработки изображений для обнаружения краев

Когда компьютерное зрение может быть использовано для обнаружения краев

Использование Ultralytics YOLO11 для более точного detect краев

Обнаружение краев в инфраструктуре с помощью компьютерного зрения

Основные выводы

Читать больше в этой категории

Что такое сопоставление изображений в Vision AI? Краткое введение

Введение в развивающуюся область нейросимволического ИИ

От битов к кубитам: Как квантовая оптимизация меняет ИИ

Давайте строить будущее ИИ вместе!

Давайте строить будущее
ИИ вместе!