Нажимая “Принять все файлы cookie”, вы соглашаетесь на сохранение файлов cookie на вашем устройстве с целью улучшения навигации по сайту, анализа использования сайта и помощи в наших маркетинговых усилиях. Подробнее
Настройки cookie
Нажимая “Принять все файлы cookie”, вы соглашаетесь на сохранение файлов cookie на вашем устройстве с целью улучшения навигации по сайту, анализа использования сайта и помощи в наших маркетинговых усилиях. Подробнее
Узнайте, чем отличается обучение с учителем от обучения без учителя в области компьютерного зрения, и как выбрать подходящий подход с учетом ваших данных и целей проекта.
Масштабируйте свои проекты в области компьютерного зрения с Ultralytics
Искусственный интеллект (ИИ) основан на ключевой концепции обучения машин способности учиться и рассуждать способами, напоминающими человеческий интеллект. Подобно тому, как люди обучаются с помощью различных методов, таких как непосредственное обучение или наблюдение за закономерностями и накопление опыта, системы ИИ и машинного обучения разработаны таким образом, чтобы использовать те же подходы.
В частности, когда речь идет об алгоритмах машинного обучения, системы обучаются на основе данных, а не программируются явно для выполнения каждой конкретной задачи. Вместо того чтобы опираться на фиксированные правила, модели машинного обучения выявляют закономерности в данных и используют их для прогнозирования или принятия решений.
Например, компьютерное зрение — это область искусственного интеллекта и машинного обучения, направленная на то, чтобы системы могли интерпретировать и понимать визуальную информацию, такую как изображения и видео. От распознавания объектов до выявления скрытых закономерностей в больших массивах данных — эти системы в значительной степени зависят от того, как их обучают.
Некоторые модели компьютерного зрения обучаются на основе меченых данных, где каждому входному значению соответствует правильный ответ, то есть каждое изображение или точка данных сопровождается заранее заданной меткой, которая указывает модели, что именно оно представляет. Это позволяет модели выучить взаимосвязь между входными данными и ожидаемым результатом, что повышает её способность делать точные прогнозы на основе новых, ранее не виденных данных.
Другие модели компьютерного зрения обучаются на немеченых данных, для которых не предусмотрено заранее определённых ответов, и вместо этого сосредоточены на выявлении закономерностей и взаимосвязей в самих данных. Эти подходы известны как контролируемое обучение и неконтролируемое обучение соответственно и составляют основу многих передовых систем компьютерного зрения.
В этой статье мы рассмотрим методы обучения с учителем и без учителя, их применение в области компьютерного зрения, а также то, как выбрать подход, который лучше всего подходит для вашего проекта в области искусственного интеллекта в сфере компьютерного зрения. Приступим!
Как методы обучения искусственного интеллекта лежат в основе компьютерного зрения
Искусственный интеллект можно сравнить с зонтиком, под которым объединены различные технологии, позволяющие машинам выполнять задачи, для которых обычно требуется человеческий интеллект. В рамках этого «зонтика» машинное обучение является ключевой областью, благодаря которой системы могут учиться на данных, а не полагаться исключительно на фиксированные правила.
В области машинного обучения различные методы обучения определяют, как модель обучается и совершенствуется с течением времени. Такие подходы, как обучение с учителем (обучение на основе меченых данных с правильными ответами), обучение без учителя (выявление закономерностей в немеченых данных), обучение с подкреплением (обучение методом проб и ошибок с использованием обратной связи или вознаграждений) и полунаблюдаемое обучение (сочетание небольшого количества меченых данных с большим количеством немеченых данных), определяют, как системы обрабатывают входные данные и генерируют выходные данные.
Рис. 1. Обзор методов обучения искусственного интеллекта (Источник)
В частности, системы компьютерного зрения создаются с использованием таких подходов к обучению для интерпретации и понимания визуальных данных. Наиболее широко используется метод контролируемого обучения, поскольку он позволяет моделям учиться на основе четко маркированных примеров и давать точные и надежные результаты.
Например, модель можно обучить на изображениях с метками «кошка» и «собака», чтобы она запомнила такие признаки, как форма, уши и строение морды, и смогла правильно classify изображения с помощью алгоритмов классификации. В то же время в компьютерном зрении также используются неконтролируемое и полуконтролируемое обучение, часто для выявления закономерностей в данных или для повышения эффективности в случаях, когда объем меченых данных ограничен.
Обзор применения моделей контролируемого обучения в компьютерном зрении
Алгоритмы обучения с учителем можно сравнить с ситуацией в классе, где учитель приводит примеры вместе с правильными ответами, чтобы ученики могли понять, что правильно, а что нет. В машинном обучении модели обучаются аналогичным образом с помощью меченых данных, где каждому входному значению соответствует известное выходное значение.
Предположим, вы занимаетесь разработкой системы компьютерного зрения, которая автоматизирует анализ бейсбольных матчей. Вы можете обучить модель, такую как Ultralytics , на изображениях или кадрах видео, где объекты, такие как мяч, бита и игроки, помечены метками.
Каждый объект будет помечен с указанием его местоположения и категории, что позволит модели научиться распознавать нужные объекты. Со временем модель сможет detect определять местоположение этих объектов на новых видеозаписях, что обеспечит возможность реализации таких сценариев использования, как отслеживание мяча и распознавание игроков на разных кадрах.
Рис. 2. Пример распознавания объектов с помощью обучения с учителем (Источник)
Помимо обнаружения объектов, обучение с учителем широко применяется в целом ряде задач компьютерного зрения, таких как классификация изображений, сегментация объектов и оценка позы, где важны точность и стабильность результатов. В каждой из этих задач модели обучаются на основе меченых данных, чтобы выявлять определенные закономерности и делать достоверные прогнозы по новым входным данным.
Эти модели, как правило, создаются с использованием глубокого обучения — одного из видов машинного обучения, в котором нейронные сети используются для распознавания закономерностей непосредственно на основе данных. Нейронные сети разработаны для обработки информации по принципу, отчасти основанному на принципах работы человеческого мозга, что позволяет моделям извлекать сложные визуальные характеристики из обширных наборов данных.
Раньше в подходах к компьютерному зрению часто использовались вручную выделенные признаки в сочетании с такими алгоритмами, как машины опорных векторов (SVM — это модели, которые classify , находя оптимальную границу между категориями) или деревья решений (модели, которые принимают решения путем разбиения данных на ветви).
В отличие от этого, современные модели компьютерного зрения используют глубокое обучение для автоматического извлечения этих характеристик из данных, что делает их более эффективными при решении масштабных и требующих высокой детализации визуальных задач.
Понимание необходимости использования моделей обучения без учителя в области искусственного интеллекта для обработки изображений
Хотя обучение с учителем является основным подходом в области компьютерного зрения, существуют определенные задачи в этой области, где маркированные данные недоступны или их сбор требует слишком больших затрат и времени.
В таких случаях алгоритмы обучения без учителя могут стать полезной альтернативой. Допустим, у вас есть большой набор фотографий без меток, полученных с помощью камеры для наблюдения за дикой природой.
Хотя к изображениям не прикреплены метки, указывающие на их содержание, вам всё равно необходимо систематизировать данные или понять их суть. Модель без учителя может проанализировать эти изображения и сгруппировать похожие из них, разделив внешне схожих животных на кластеры, даже не зная их точных меток.
Как работает обучение без учителя в компьютерном зрении
Итак, как же работает неконтролируемое машинное обучение? Вместо того чтобы учиться на правильных ответах, модель обучается, самостоятельно выявляя закономерности и структуру в данных. Она ищет сходства и различия в данных, не опираясь на помеченные примеры.
Одним из распространенных вариантов применения является обнаружение аномалий, при котором модель изучает, как выглядят нормальные данные, а затем выявляет все, что от них отклоняется. Обнаружение аномалий и выбросов — одно из наиболее значимых промышленных применений. Примеры включают выявление бракованных изделий на производственной линии, отметку необычных медицинских снимков для проверки радиологом или обнаружение подозрительной активности на записях систем видеонаблюдения. Поскольку дефекты и аномалии часто встречаются редко и бывают разнообразными, маркировка каждого возможного случая нецелесообразна, что делает подходы без учителя естественным выбором.
Для решения этой задачи часто используются такие методы, как кластеризация и уменьшение размерности, причем обычно они применяются не к исходным изображениям, а к признакам, извлеченным из них. Методы кластеризации, такие как кластеризация по k-средним, объединяют похожие изображения на основе общих паттернов, в то время как методы уменьшения размерности, например анализ главных компонент (PCA), упрощают данные, фокусируясь на наиболее важных признаках.
Это облегчает модели выявление значимых закономерностей и структуры в больших и сложных наборах данных. Главное преимущество неконтролируемого обучения заключается в том, что оно хорошо работает с немечеными данными и позволяет выявлять закономерности, которые не сразу бросаются в глаза. Однако его сложнее оценить, и оно обеспечивает меньший контроль над конечным результатом по сравнению с контролируемым обучением.
Самоконтролируемое и полуконтролируемое обучение в области компьютерного зрения
Изучая методы контролируемого и неконтролируемого обучения, вы, возможно, зададитесь вопросом, существует ли нечто среднее между ними. Интересно, что самоконтролируемое и полуконтролируемое обучение как раз и заполняют этот пробел между контролируемым и неконтролируемым обучением.
Эти подходы позволяют моделям более эффективно обучаться на данных без меток. Вместо того чтобы полагаться исключительно на помеченные примеры, они либо самостоятельно формируют задачи обучения на основе данных, либо объединяют небольшой набор помеченных данных с более обширным набором данных без меток.
При самоконтролируемом обучении модель обучается, решая задачи, сформированные на основе самих данных. Например, ей может быть предоставлено изображение с отсутствующей частью, и она научится предсказывать, чем следует заполнить это пространство, или же она может научиться распознавать различные ракурсы одного и того же объекта. Это помогает модели выделять полезные признаки без необходимости использования ручных меток.
С другой стороны, при полунаблюдаемом обучении для повышения эффективности используется небольшой объем помеченных данных наряду с более обширным набором непомеченных данных. В некоторых случаях модель может генерировать метки для непомеченных данных и использовать их для продолжения обучения.
Основное преимущество этих подходов заключается в том, что они снижают потребность в больших наборах данных с метками, создание которых зачастую требует значительных затрат и времени. Однако их разработка и оценка могут оказаться более сложной задачей по сравнению с методами с полным контролем.
Основные различия между обучением с учителем и обучением без учителя
Разница между обучением с учителем и обучением без учителя сводится к тому, как модель обучается и каких целей она стремится достичь. В то время как обучение с учителем опирается на помеченные данные и четкие инструкции для освоения конкретных задач, обучение без учителя происходит без заранее заданных ответов и сосредоточено на выявлении закономерностей и структуры в данных.
Например, в системе мониторинга дорожного движения модель с учителем можно обучить на основе помеченных изображений для detect , пешеходов или светофоров. В отличие от этого, модель без учителя может анализировать большие объемы видеозаписей для группировки схожих ситуаций на дороге или выявления необычных событий, таких как неожиданные заторы или нестандартные движения, без явных указаний на то, что именно следует искать.
Когда следует использовать обучение с учителем в компьютерном зрении
Обучение с учителем — отличный вариант для задач компьютерного зрения, в которых цель четко определена, а модель должна преобразовывать входные данные в точные результаты. Оно особенно хорошо подходит в тех случаях, когда у вас есть надежный набор данных с метками и требуются стабильные, предсказуемые результаты.
Рис. 3. Задачи компьютерного зрения, основанные на обучении с учителем (Источник)
Обычно этот подход применяется для решения задач, в которых модель должна различать известные категории или прогнозировать конкретные результаты. Вместо поиска закономерностей основное внимание уделяется обучению точным взаимосвязям на основе меченых данных, что упрощает направление модели к желаемому результату.
Еще одним важным преимуществом является возможность контроля. При обучении с учителем проще оценивать эффективность с помощью четких показателей, настраивать модель и обеспечивать стабильную работу при развертывании. Благодаря этому этот подход идеально подходит для систем, которым требуется стабильность и надежность в долгосрочной перспективе.
Однако это сопряжено с определенными недостатками. Модель в значительной степени зависит от качества и объема помеченных данных, а сбор и аннотирование таких данных может занимать много времени.
Реальные примеры компьютерного зрения с учителем
Модели искусственного интеллекта для обработки изображений, такие как YOLO Ultralytics YOLO , используют контролируемое обучение для выполнения таких задач, как распознавание объектов с высокой точностью, особенно в приложениях, работающих в режиме реального времени. Ниже приведены некоторые типичные реальные примеры применения систем компьютерного зрения, в которых контролируемое обучение играет ключевую роль:
Здравоохранение и медицинская визуализация: врачи могут использовать системы компьютерного зрения, обученные на помеченных снимках, таких как рентгеновские снимки или МРТ, где классификаторы применяются для выявления таких состояний, как опухоли или переломы, что способствует более быстрой и точной диагностике.
Промышленный контроль качества: в производственных условиях системы машинного зрения, обученные на основе меченых данных, могут контролировать продукцию, анализируя ряд характеристик, влияющих на качество, таких как форма, дефекты поверхности, текстура и размер. Обучаясь на примерах как годной, так и бракованной продукции, эти системы способны стабильно выявлять дефекты и обеспечивать соблюдение производственных стандартов.
Автономное вождение: системы автономного вождения используют модели, обученные на основе помеченных данных о вождении, для распознавания полос движения, транспортных средств, пешеходов и дорожных знаков, что помогает автомобилям безопасно ориентироваться в дорожной обстановке в режиме реального времени.
Системы розничной торговли и оформления покупок: магазины используют модели, обученные на помеченных изображениях товаров, для распознавания товаров на полках или на кассе, что позволяет автоматизировать выставление счетов и повысить эффективность управления запасами. В сочетании с дополнительными данными эти системы также могут использоваться для таких задач, как сегментация клиентов, помогая предприятиям лучше понимать особенности поведения покупателей.
Сельское хозяйство и мониторинг урожая: фермеры могут использовать модели, обученные на помеченных изображениях, для detect classify , например, для идентификации и подсчета здорового и поврежденного картофеля, что позволяет улучшить контроль качества и сократить потери.
Рис. 4. Использование YOLO detect подсчета здорового и бракованного картофеля
Какие задачи в области компьютерного зрения можно решить с помощью обучения без учителя
Обучение без учителя полезно в тех случаях, когда у вас недостаточно меченых данных или когда ваши данные не содержат однозначных ответов. В таких ситуациях цель состоит не в том, чтобы делать точные прогнозы, а в том, чтобы понять закономерности и структуру данных.
Этот подход часто используется при первом изучении набора данных без меток. Вместо того чтобы указывать модели, на что обращать внимание, вы даете ей возможность самостоятельно выявлять сходства, группировать похожие изображения или выделять необычные закономерности.
При работе с большим набором изображений метод без учителя может помочь сгруппировать похожие изображения или выделить аномальные значения, требующие дополнительного внимания. Это делает его полезной отправной точкой для проектов в области анализа данных.
Генеративные модели, в том числе GAN, вариационные автокодировщики и диффузионные модели, обучаются базовому распределению изображений, чтобы создавать совершенно новые. Эти модели лежат в основе таких приложений, как синтез изображений, восстановление утраченных участков, повышение разрешения и перенос стиля, и составляют основу современных генеративных систем искусственного интеллекта.
Неконтролируемая сегментация: некоторые методы группируют пиксели или области в связные сегменты без использования меченых масок, что полезно в случаях, когда аннотирование требует слишком больших затрат или когда цель заключается в выявлении структуры, а не в сопоставлении с заранее заданными категориями.
Обучение без учителя также оказывает значительное влияние при работе с большими наборами данных, когда их маркировка требует много времени или является нецелесообразной. В таких случаях оно позволяет извлекать полезную информацию из данных, не полагаясь на маркированные обучающие данные.
Оно также широко применяется в таких областях, как генеративный ИИ (модели, создающие новые данные, такие как изображения, текст или аудио) и обучение представлениям (модели, извлекающие полезные признаки или закономерности из необработанных данных), где модели выделяют общие признаки на основе больших массивов данных. В целом, если ваша задача связана с исследованием, выявлением закономерностей или работой с немечеными данными, обучение без учителя является гибким и практичным подходом, который стоит рассмотреть.
Реальные примеры неконтролируемого обучения в области компьютерного зрения
Вот несколько примеров сценариев использования, в которых в области компьютерного зрения применяется обучение без учителя:
Обнаружение аномалий в производстве: модели могут запоминать, как выглядят нормальные изделия, и выявлять дефекты или отклонения, не нуждаясь в помеченных примерах каждого возможного дефекта.
Систематизация и поиск изображений: обширные коллекции изображений, такие как фотобиблиотеки или каталоги интернет-магазинов, можно автоматически группировать на основе визуального сходства, что упрощает специалистам по обработке данных систематизацию, анализ и поиск в больших наборах данных.
Наблюдение и безопасность: системы могут анализировать видеозаписи для выявления необычных закономерностей или поведения, таких как неожиданные движения или изменения в поведении толпы, без предварительного обучения на основе помеченных событий.
Предварительная обработка и анализ данных: методы без учителя часто используются для анализа и систематизации необработанных изображений перед обучением моделей с учителем, что помогает повысить качество данных и сократить объем ручной работы.
Практические ограничения обучения с учителем и без учителя
Несмотря на преимущества обоих подходов к обучению, следует учитывать и определенные ограничения. Вот несколько практических моментов, о которых стоит помнить при построении моделей компьютерного зрения:
Переобучение в моделях с учителем: при обучении с учителем модель может слишком точно повторять особенности обучающих данных вместо того, чтобы выделять общие закономерности. Часто это происходит, когда набор данных небольшой или недостаточно разнообразен. Например, модель, обученная на detect в одном типе продукции, может дать сбой при тестировании на новых данных, содержащих продукцию или условия освещения, которые немного отличаются от исходных.
Проблемы, связанные с алгоритмами кластеризации: при неконтролируемом обучении модель может объединять в группы схожие точки данных. Однако этот подход может оказаться неэффективным, если данные содержат шумы, являются несогласованными или не имеют четкой структуры. Например, при группировке изображений изображения с похожими цветами, но разными объектами могут быть неправильно объединены в одну группу.
Важность правильной предварительной обработки: перед обучением данные необходимо очистить и подготовить. Обычно это делается с помощью Python , предназначенных для обработки изображений и преобразования данных. Это особенно важно в области компьютерного зрения, где изображения могут различаться по размеру, качеству или освещению. Без надлежащей предварительной обработки модели могут учиться на шуме вместо значимых закономерностей, что приводит к низкой эффективности.
Основные выводы
В области компьютерного зрения важную роль играют как обучение с учителем, так и обучение без учителя. Выбор подходящего подхода зависит от типа имеющихся данных — с метками или без — а также от задачи, которую вы пытаетесь решить, и ваших требований к развертыванию.
Если ваша цель — высокая точность и четко определённые результаты, то обучение с учителем часто является лучшим выбором. Если же вы занимаетесь исследованием данных или работаете с данными без меток, то более подходящим вариантом может оказаться обучение без учителя.