Изучите пороговую обработку в обработке изображений с помощью этого руководства. Узнайте, что такое пороговая обработка, различные методы пороговой обработки изображений, включая пороговую обработку Оцу.

Изучите пороговую обработку в обработке изображений с помощью этого руководства. Узнайте, что такое пороговая обработка, различные методы пороговой обработки изображений, включая пороговую обработку Оцу.
Как люди, мы воспринимаем изображения как целостные, осмысленные картины, в то время как компьютеры видят их как сетки крошечных пикселей - мельчайших компонентов цифрового изображения. В процессе обработки изображений эти пиксели можно корректировать или анализировать, чтобы улучшить изображение и извлечь из него полезную информацию.
Один из распространенных методов обработки изображений называется пороговым выделением. Этот метод преобразует полутоновые изображения (где каждый пиксель представляет собой оттенок серого) в черно-белые, сравнивая каждый пиксель с заданным значением. Это позволяет четко отделить важные области от фона.
Пороговое выделение часто используется при сегментации изображений, когда изображение разбивается на значимые области, чтобы облегчить его анализ. Как правило, это один из первых шагов, помогающих машинам интерпретировать визуальные данные. В этой статье мы рассмотрим, что такое пороговая обработка, как она работает и где применяется в реальных сценариях. Давайте начнем!
Прежде чем перейти к рассмотрению того, как работает пороговое выделение, давайте рассмотрим основные идеи, лежащие в его основе, и то, как оно используется в обработке изображений.
Допустим, вы работаете с изображением и хотите отделить объекты на нем от фона. Один из способов сделать это - пороговое выделение. При этом изображение упрощается так, что каждый пиксель становится либо полностью черным, либо полностью белым. В результате получается бинарное изображение, где каждый пиксель имеет значение 0 (черный) или 255 (белый). Этот шаг часто бывает полезен при обработке изображений, поскольку позволяет четко выделить важные части изображения.
Аналогично, если вы хотите понять, как распределяются значения яркости по изображению, вам поможет гистограмма. Это график, который показывает, как часто встречается интенсивность каждого пикселя, от черного (0) до белого (255).
Взглянув на гистограмму, вы сможете понять, является ли изображение темным, ярким или находится где-то между ними. Это облегчает выбор хорошего порогового значения при преобразовании изображения в черно-белое, так как вы можете сразу заметить детали и уровни контраста.
После пороговой обработки изображение делится на две части: передний план и фон. Передний план, обычно показанный белым цветом, выделяет важные элементы, такие как текст, фигуры или объекты, которые вы хотите обнаружить. Фон, показанный черным цветом, - это все остальное. Такое разделение помогает машинам сосредоточиться на главном в изображении.
Как уже говорилось, сегментация разделяет изображение на значимые области на основе таких признаков, как яркость или текстура. Пороговая обработка - простой способ сделать это и часто является одним из первых шагов в конвейере компьютерного зрения.
Компьютерное зрение - это область искусственного интеллекта, позволяющая машинам обрабатывать и интерпретировать визуальные данные, подобно человеку. Используя пороговое выделение на ранних этапах процесса, системы компьютерного зрения могут отделить объекты от фона, что облегчает последующие этапы, такие как обнаружение или распознавание, и делает их более точными.
Теперь, когда мы лучше понимаем, что такое пороговая обработка, давайте рассмотрим, как сделать пороговую обработку изображения и различные типы пороговой обработки в обработке изображений.
Например, глобальное пороговое выделение - один из самых простых способов создания бинарного изображения. Он применяет единое значение интенсивности ко всему изображению. Пиксели ярче этого порога становятся белыми, а более темные - черными. Это помогает отделить объект от фона.
Лучше всего он работает при равномерном освещении и высокой контрастности изображения. Но при неравномерном освещении или в малоконтрастных областях один порог может упустить детали или размыть края.
Для решения этой проблемы используются методы, подобные пороговой обработке Оцу. Вместо того чтобы задавать значение вручную, метод пороговой обработки Отсу анализирует гистограмму изображения и выбирает порог, который наилучшим образом разделяет интенсивность пикселей на передний и задний план.
В отличие от глобальной пороговой обработки, адаптивная или локальная пороговая обработка рассчитывает пороговое значение отдельно для разных частей изображения. Это делает его более эффективным для изображений с неравномерным освещением, таких как отсканированные документы с тенями или текстурированные поверхности.
Он работает путем разделения изображения на небольшие области и вычисления локального порога для каждого блока, что позволяет поддерживать контраст между передним и задним планом. Этот подход широко используется в таких задачах, как распознавание текста, медицинская визуализация и контроль поверхностей, где освещение меняется по всему изображению.
Среди распространенных подходов к адаптивной пороговой обработке изображений - адаптивная средняя пороговая обработка и адаптивная гауссова пороговая обработка. При адаптивном среднем пороге в качестве порога для центрального пикселя используется средняя интенсивность пикселя в локальной окрестности. Адаптивный гауссовый порог, с другой стороны, использует средневзвешенное значение с гауссовым окном, придавая большее значение пикселям, расположенным ближе к центру.
Далее мы рассмотрим, где пороговое преобразование изображений используется в реальных приложениях.
Старые книги и рукописные письма часто сканируют, чтобы сохранить их или преобразовать в цифровой текст с помощью OCR (Optical Character Recognition)- технологии, которая считывает печатные или рукописные символы. Перед извлечением текста документ обычно нуждается в очистке или предварительной обработке. На отсканированных изображениях часто присутствуют тени, выцветшие чернила или неравномерное освещение, что может затруднить распознавание символов.
Для повышения четкости используется пороговая обработка, преобразующая полутоновые изображения в двоичный формат, что помогает выделить текст из фона. Темные участки, например буквы, становятся черными, а светлый фон - белым, что значительно облегчает распознавание текста системами OCR.
Аналогично, в медицинской визуализации пороговое выделение обычно используется для выделения определенных структур на снимках, например костей или легких на рентгеновских снимках. Преобразуя полутоновые изображения в двоичный формат, становится проще отделить интересующие области от окружающих тканей и подготовить изображение к дальнейшему анализу. В более сложных случаях можно применить многоуровневую пороговую обработку, чтобы разделить изображение на несколько отдельных областей, что позволяет одновременно идентифицировать различные типы тканей или структур.
Вот некоторые из ключевых преимуществ использования порогового метода в обработке изображений:
Хотя пороговая обработка изображений полезна во многих сценариях, она также имеет определенные ограничения. Вот некоторые проблемы, связанные с пороговой обработкой, которые следует учитывать:
Пороговая обработка хорошо подходит для простых задач сегментации в контролируемых условиях. Однако при работе со сложными изображениями, содержащими несколько объектов или фоновый шум, она часто оказывается неэффективной. Поскольку пороговая обработка опирается на фиксированные правила, ей не хватает гибкости, необходимой для большинства реальных приложений.
Чтобы выйти за эти рамки, многие передовые системы сегодня используют компьютерное зрение. В отличие от пороговой обработки, модели искусственного зрения обучаются выявлять сложные паттерны и особенности, что делает их гораздо более точными и адаптируемыми.
Например, модели компьютерного зрения, такие как Ultralytics YOLO11, могут обнаруживать объекты и сегментировать изображения в режиме реального времени. Это делает их идеальными для таких задач, как обнаружение сигналов светофора в автономных автомобилях или выявление проблем с урожаем в сельском хозяйстве.
В частности, YOLO11 поддерживает ряд задач компьютерного зрения, таких как сегментация объектов, когда каждый объект на изображении сегментируется отдельно. Он также может выполнять другие задачи, основанные на компьютерном зрении, включая оценку позы (определение положения или позы объекта) и отслеживание объекта (слежение за объектом при его перемещении по видеокадрам).
Хотя пороговая обработка хорошо подходит для простых задач или тестирования ранних идей, приложения, требующие скорости, точности и гибкости, обычно лучше решать с помощью компьютерного зрения.
Пороговая обработка - важнейший инструмент в обработке изображений, поскольку с его помощью можно быстро и легко отделить объекты от фона. Он хорошо работает с отсканированными документами, медицинскими изображениями и при проверке дефектов продукции на заводах.
Однако по мере усложнения изображений и видео базовые методы обработки изображений, такие как пороговая обработка, могут оказаться неэффективными. Именно здесь на помощь приходят продвинутые модели компьютерного зрения. Такие модели, как YOLO11, могут понимать и выполнять больше задач, замечать множество объектов одновременно и работать в режиме реального времени, что делает их полезными для многих случаев использования.
Хотите узнать больше об искусственном интеллекте? Ознакомьтесь с нашим сообществом и репозиторием GitHub. Изучите страницы наших решений, чтобы узнать об ИИ в робототехнике и компьютерном зрении в сельском хозяйстве. Узнайте о наших вариантах лицензирования и начните строить с помощью компьютерного зрения уже сегодня!