Руководства

Изучение обучения с учителем и без учителя в компьютерном зрении

Изучи различия между обучением с учителем и без учителя в компьютерном зрении и узнай, как выбрать правильный подход для твоих данных и целей проекта.

ABAbirami Vina7 min readApril 20, 2026

Обучение с учителем против обучения без учителя в компьютерном зрении

Искусственный интеллект (ИИ) строится на базовой концепции обучения машин распознавать и рассуждать способами, напоминающими человеческий интеллект. Подобно тому, как люди учатся с помощью различных методов, таких как прямое наставление или наблюдение за закономерностями и опытом, системы ИИ и машинного обучения спроектированы так, чтобы следовать этим же подходам.

В частности, когда речь заходит об алгоритмах машинного обучения, системы обучаются на данных, а не программируются явно для каждой задачи. Вместо того чтобы полагаться на фиксированные правила, модели машинного обучения определяют закономерности в данных и используют их для прогнозирования или принятия решений.

Например, компьютерное зрение — это область ИИ и машинного обучения, которая фокусируется на том, чтобы системы могли интерпретировать и понимать визуальную информацию, такую как изображения и видео. От распознавания объектов до выявления скрытых закономерностей в больших наборах данных — эти системы сильно зависят от того, как они были обучены.

Для обучения таких систем используются различные методы обучения ИИ, в зависимости от типа доступных данных и решаемой задачи.

Некоторые модели компьютерного зрения обучаются на размеченных данных, где каждый входной сигнал связан с правильным ответом, что означает, что каждое изображение или точка данных имеют предопределенную метку, которая сообщает модели, что именно она представляет. Это позволяет модели изучить связь между входными данными и ожидаемым результатом, улучшая её способность делать точные прогнозы на новых, ранее не виденных данных.

Другие модели зрения обучаются на неразмеченных данных, где нет заранее заданных ответов, и фокусируются на выявлении закономерностей и связей внутри самих данных. Эти подходы соответственно называются контролируемым обучением и неконтролируемым обучением, и они составляют основу многих передовых систем компьютерного зрения.

В этой статье мы рассмотрим контролируемое и неконтролируемое обучение, узнаем, как они используются в компьютерном зрении и как выбрать подход, который лучше всего подходит для твоего проекта в области ИИ зрения. Начнем!

Link to this sectionКак подходы к обучению ИИ расширяют возможности компьютерного зрения#

Ты можешь представить искусственный интеллект как зонтик, охватывающий целый ряд технологий, позволяющих машинам выполнять задачи, которые обычно требуют человеческого интеллекта. В рамках этого зонтика машинное обучение является ключевой областью, которая позволяет системам учиться на данных, вместо того чтобы полагаться только на фиксированные правила.

В рамках машинного обучения различные методы определяют, как модель учится и совершенствуется с течением времени. Такие подходы, как контролируемое обучение (обучение на размеченных данных с правильными ответами), неконтролируемое обучение (выявление закономерностей в неразмеченных данных), обучение с подкреплением (обучение методом проб и ошибок с использованием обратной связи или вознаграждений) и полуконтролируемое обучение (объединение небольшого количества размеченных данных с большим объемом неразмеченных данных), определяют, как системы обрабатывают входные данные и генерируют выходные.

Обзор методов обучения ИИ

Рис 1. Обзор методов обучения ИИ (Источник)

В частности, системы компьютерного зрения строятся с использованием таких подходов к обучению, чтобы интерпретировать и понимать визуальные данные. Контролируемое обучение является наиболее часто используемым методом, так как оно позволяет моделям учиться на четко размеченных примерах и выдавать точные и надежные результаты.

Например, модель можно обучить на изображениях, помеченных как «кошка» и «собака», изучив такие признаки, как форма, уши и строение морды, чтобы она могла правильно классифицировать новые изображения с помощью алгоритмов классификации. В то же время неконтролируемое и полуконтролируемое обучение также используются в компьютерном зрении, часто для исследования закономерностей в данных или для улучшения производительности, когда размеченных данных недостаточно.

Link to this sectionВзгляд на использование моделей контролируемого обучения в компьютерном зрении#

Ты можешь сравнить алгоритмы контролируемого обучения с классом в школе, где учитель предоставляет примеры вместе с правильными ответами, чтобы ученики могли понять, что правильно, а что нет. В машинном обучении модели учатся аналогичным образом, используя размеченные данные, где каждому входу соответствует известный выход.

Представь, что ты работаешь над созданием системы компьютерного зрения, которая автоматизирует анализ бейсбольных матчей. Ты можешь обучить модель, такую как Ultralytics YOLO26, на изображениях или кадрах видео, где объекты, такие как мяч, бита и игроки, размечены.

Каждый объект будет помечен своим местоположением и категорией, что позволит модели узнать, что именно нужно искать. Со временем модель сможет обнаруживать и находить эти объекты на новых кадрах, поддерживая такие сценарии использования, как отслеживание мяча и обнаружение игроков в кадрах.

Пример обнаружения объектов с помощью обучения с учителем

Рис 2. Пример обнаружения объектов, реализованный с помощью контролируемого обучения (Источник)

Помимо обнаружения объектов, контролируемое обучение широко используется в ряде задач компьютерного зрения, таких как классификация изображений, сегментация экземпляров и оценка позы, где важны точность и согласованность. В каждой из этих задач модели учатся на размеченных данных, чтобы определять конкретные закономерности и делать надежные прогнозы на новых входных данных.

Эти модели обычно создаются с использованием глубокого обучения — типа машинного обучения, который использует нейронные сети для изучения закономерностей непосредственно на данных. Нейронные сети спроектированы для обработки информации способом, который отдаленно вдохновлен тем, как работает человеческий мозг, что позволяет моделям изучать сложные визуальные признаки из больших наборов данных.

Более ранние подходы к компьютерному зрению часто полагались на вручную разработанные признаки в сочетании с такими алгоритмами, как машины опорных векторов (SVM — это модели, которые классифицируют данные, находя лучшую границу между категориями) или деревья решений (модели, которые принимают решения, разделяя данные на ветви).

В отличие от них, модели компьютерного зрения сегодня используют глубокое обучение для автоматического изучения этих признаков из данных, что делает их более эффективными при решении крупномасштабных и высокодетализированных визуальных задач.

Link to this sectionПонимание необходимости моделей неконтролируемого обучения в ИИ зрения#

Хотя контролируемое обучение является основным подходом в компьютерном зрении, существуют определенные приложения, где размеченные данные недоступны или их создание слишком дорого и трудоемко.

В этих случаях алгоритмы неконтролируемого обучения могут быть полезной альтернативой. Допустим, у тебя есть большая коллекция неразмеченных фотографий с камеры дикой природы.

Нет никаких меток, указывающих, что содержится на каждом изображении, но ты все равно хочешь упорядочить или понять эти данные. Неконтролируемая модель может проанализировать эти изображения и сгруппировать похожие, разделяя похожих животных на кластеры, даже не зная их точных меток.

Link to this sectionКак работает неконтролируемое обучение в компьютерном зрении#

Итак, как работает неконтролируемое машинное обучение? Вместо обучения на правильных ответах модель учится, самостоятельно выявляя закономерности и структуру в данных. Она ищет сходства и различия в данных, не полагаясь на размеченные примеры.

Распространенным сценарием использования является обнаружение аномалий, где модель изучает, как выглядят нормальные данные, а затем идентифицирует все, что отклоняется от них. Обнаружение аномалий и выбросов — одно из самых значимых промышленных применений. Примеры включают обнаружение дефектных изделий на производственной линии, пометку необычных медицинских снимков для проверки рентгенологом или обнаружение подозрительной активности на кадрах наблюдения. Поскольку дефекты и аномалии часто редки и разнообразны, маркировка каждого возможного случая непрактична, что делает неконтролируемые подходы естественным выбором.

Для поддержки этого часто используются такие методы, как кластеризация и снижение размерности, обычно на признаках, извлеченных из изображений, а не на самих исходных изображениях. Методы кластеризации, такие как кластеризация k-средних, группируют похожие изображения на основе общих закономерностей, в то время как методы снижения размерности, такие как метод главных компонент (PCA), упрощают данные, фокусируясь на наиболее важных признаках.

Это облегчает модели выявление значимых закономерностей и структур внутри больших и сложных наборов данных. Главное преимущество неконтролируемого обучения заключается в том, что оно хорошо работает с неразмеченными данными и может выявлять закономерности, которые не сразу очевидны. Однако его труднее оценить, и оно дает меньше контроля над окончательным результатом по сравнению с контролируемым обучением.

Link to this sectionСамообучающееся и полуконтролируемое обучение в компьютерном зрении#

Изучая контролируемое и неконтролируемое обучение, ты можешь задаться вопросом, есть ли золотая середина между ними. Интересно, что самообучающееся и полуконтролируемое обучение заполняют пробел между ними.

Эти подходы позволяют моделям более эффективно учиться на неразмеченных данных. Вместо того чтобы полагаться только на размеченные примеры, они либо создают свои собственные задачи обучения на основе данных, либо объединяют небольшой размеченный набор данных с большим неразмеченным.

В самообучающемся обучении модель учится, решая задачи, созданные на основе самих данных. Например, ей может быть дано изображение с недостающей частью, и она научится предсказывать, что должно заполнить это пространство, или она может научиться распознавать разные виды одного и того же объекта. Это помогает модели изучать полезные признаки без необходимости в ручной разметке.

С другой стороны, в полуконтролируемом обучении небольшое количество размеченных данных используется вместе с большим набором неразмеченных данных для повышения производительности. В некоторых случаях модель может сама генерировать метки для неразмеченных данных и использовать их для дальнейшего обучения.

Ключевое преимущество этих подходов заключается в том, что они снижают потребность в больших размеченных наборах данных, создание которых часто бывает дорогим и трудоемким. Однако они могут быть более сложными в проектировании и оценке по сравнению с полностью контролируемыми методами.

Link to this sectionОсновные различия между контролируемым и неконтролируемым обучением#

Разница между контролируемым и неконтролируемым обучением сводится к тому, как модель учится и чего она пытается достичь. В то время как контролируемое обучение опирается на размеченные данные и четкие инструкции для изучения конкретных задач, неконтролируемое обучение работает без заранее заданных ответов и фокусируется на обнаружении закономерностей и структур внутри данных.

Например, в системе мониторинга дорожного движения модель контролируемого обучения может быть обучена на размеченных изображениях для обнаружения транспортных средств, пешеходов или сигналов светофора. В отличие от нее, неконтролируемая модель могла бы анализировать большие объемы видеозаписей, чтобы сгруппировать похожие модели движения транспорта или выявить необычные события, такие как неожиданные заторы или аномальное движение, не получая при этом явных инструкций о том, что именно нужно искать.

Link to this sectionКогда следует использовать контролируемое обучение в компьютерном зрении#

Контролируемое обучение — отличный вариант для задач компьютерного зрения, где цель четко определена, а модели необходимо сопоставить входные данные с точными выходными результатами. Оно особенно хорошо работает, когда у тебя есть надежный размеченный набор данных и нужны стабильные, предсказуемые результаты.

Задачи компьютерного зрения, решаемые с помощью обучения с учителем

Рис 3. Задачи компьютерного зрения, основанные на контролируемом обучении (Источник)

Оно широко используется для задач, где модель должна различать известные категории или предсказывать конкретные исходы. Вместо исследования закономерностей внимание сосредоточено на изучении точных связей из размеченных данных, что облегчает направление модели к желаемому результату.

Еще одно ключевое преимущество — контроль. При контролируемом обучении легче измерить производительность с помощью четких метрик, донастроить модель и обеспечить стабильное поведение при развертывании. Это делает его идеальным для систем, требующих последовательности и надежности с течением времени.

Однако у этого есть и обратная сторона. Модель сильно зависит от качества и масштаба размеченных данных, а сбор и аннотирование таких данных могут потребовать много времени.

Link to this sectionПримеры контролируемого компьютерного зрения в реальном мире#

Модели ИИ зрения, такие как модели Ultralytics YOLO, используют контролируемое обучение для выполнения задач, таких как обнаружение объектов с высокой точностью, особенно в приложениях реального времени. Вот некоторые распространенные примеры использования зрения в реальном мире, где контролируемое обучение имеет значение:

Здравоохранение и медицинская визуализация: Врачи могут использовать системы компьютерного зрения, обученные на размеченных снимках, таких как рентген или МРТ, где классификаторы используются для выявления состояний, таких как опухоли или переломы, что способствует более быстрому и точному диагнозу.
Промышленный контроль качества: В производственных условиях системы зрения, обученные на размеченных данных, могут проверять изделия, анализируя ряд признаков, связанных с качеством, таких как форма, дефекты поверхности, текстура и размер. Учась на примерах как приемлемых, так и дефектных изделий, эти системы могут стабильно выявлять ошибки и поддерживать производственные стандарты.
Автономное вождение: Системы беспилотного вождения полагаются на модели, обученные на размеченных данных вождения для распознавания полос движения, транспортных средств, пешеходов и дорожных знаков, помогая транспортным средствам безопасно перемещаться в реальном времени.
Розничная торговля и системы оплаты: Магазины используют модели, обученные на размеченных изображениях товаров для идентификации товаров на полках или на кассе, обеспечивая автоматизированную оплату и более эффективное управление запасами. Эти системы также могут поддерживать задачи, такие как сегментация клиентов при объединении с дополнительными данными, помогая бизнесу лучше понимать покупательские привычки.
Сельское хозяйство и мониторинг урожая: Фермеры могут использовать модели, обученные на размеченных изображениях для обнаружения и классификации урожая, например, для идентификации и подсчета здорового и поврежденного картофеля, что улучшает контроль качества и сокращает потери.

Использование YOLO для обнаружения и подсчета здорового и дефектного картофеля

Рис 4. Использование YOLO для обнаружения и подсчета здорового и дефектного картофеля

Link to this sectionКакие проблемы в компьютерном зрении может решить неконтролируемое обучение#

Неконтролируемое обучение полезно, когда у тебя недостаточно размеченных данных или когда твои данные не содержат четких ответов. В этих ситуациях цель заключается не в том, чтобы сделать точные прогнозы, а в том, чтобы понять закономерности и структуру в данных.

Оно часто используется при первом исследовании неразмеченного набора данных. Вместо того чтобы говорить модели, что нужно искать, ты позволяешь ей самой определять сходства, группировать похожие изображения или выделять необычные закономерности.

В большой коллекции изображений неконтролируемый подход может помочь упорядочить похожие изображения или пометить выбросы, которые могут потребовать дальнейшего внимания. Это делает его полезной отправной точкой в проектах по анализу данных.

Генеративные модели, включая GAN, вариационные автокодировщики и диффузионные модели, изучают лежащее в основе распределение изображений для создания совершенно новых. Эти модели обеспечивают работу таких приложений, как синтез изображений, заполнение пропусков (inpainting), сверхразрешение и перенос стиля, и они составляют основу современных генеративных систем ИИ.

В неконтролируемой сегментации некоторые методы группируют пиксели или области в согласованные сегменты, не полагаясь на размеченные маски, что полезно, когда аннотирование слишком дорого или когда цель состоит в обнаружении структуры, а не в соответствии заранее заданным категориям.

Неконтролируемое обучение также эффективно при работе с большими наборами данных, где разметка требует много времени или непрактична. В таких случаях оно позволяет получить инсайты из данных, не полагаясь на размеченные обучающие данные.

Оно также часто используется в таких областях, как генеративный ИИ (модели, которые создают новые данные, такие как изображения, текст или аудио) и обучение представлений (модели, которые изучают полезные признаки или закономерности из необработанных данных), где модели изучают общие признаки из больших объемов данных. В целом, если твоя задача включает исследование, обнаружение закономерностей или работу с неразмеченными данными, неконтролируемое обучение — это гибкий и практичный подход, который стоит рассмотреть.

Link to this sectionПримеры неконтролируемого обучения в компьютерном зрении в реальном мире#

Вот некоторые примеры использования неконтролируемого обучения в компьютерном зрении:

Обнаружение аномалий в производстве: Модели могут изучать, как выглядят нормальные продукты, и могут помечать дефекты или нарушения без необходимости наличия размеченных примеров каждого возможного дефекта.
Организация и поиск изображений: Большие коллекции изображений, такие как фотобиблиотеки или каталоги электронной коммерции, могут быть автоматически сгруппированы на основе визуального сходства, что облегчает специалистам по данным организацию, исследование и поиск по большим наборам данных.
Наблюдение и безопасность: Системы могут анализировать видеозаписи для выявления необычных закономерностей или моделей поведения, таких как неожиданное перемещение или изменения в толпе, без явного обучения на размеченных событиях.
Предварительная обработка и исследование данных: Неконтролируемые методы часто используются для исследования и структурирования необработанных данных изображений перед обучением контролируемых моделей, помогая улучшить качество данных и снизить объем ручного труда.

Link to this sectionПрактические ограничения контролируемого и неконтролируемого обучения#

Несмотря на преимущества обоих подходов, есть определенные ограничения, которые следует учитывать. Вот некоторые практические факторы, о которых нужно помнить при создании моделей компьютерного зрения:

Переобучение в контролируемых моделях: В контролируемом обучении модель может слишком тесно подстроиться под обучающие данные вместо изучения общих закономерностей. Это часто происходит, когда набор данных мал или недостаточно разнообразен. Например, модель, обученная обнаруживать дефекты в одном типе продукта, может подвести при тестировании на новых данных, состоящих из немного других продуктов или условий освещения.
Проблемы с алгоритмами кластеризации: В неконтролируемом обучении модель может группировать похожие точки данных вместе. Однако это может перестать работать, если данные зашумлены, противоречивы или лишены четкой структуры. Например, в задачах группировки изображений изображения с похожими цветами, но разными объектами могут быть сгруппированы вместе неверно.
Важность правильной предварительной обработки: Перед обучением данные должны быть очищены и подготовлены. Обычно это делается с помощью библиотек Python, которые обрабатывают изображения и трансформируют данные. Это особенно важно в компьютерном зрении, где изображения могут различаться по размеру, качеству или освещению. Без надлежащей предварительной обработки модели могут учиться на шуме вместо значимых закономерностей, что ведет к низкой производительности.

Link to this sectionОсновные выводы#

В компьютерном зрении как контролируемое, так и неконтролируемое обучение играют важную роль. Правильный подход зависит от типа данных, которые у тебя есть, являются ли они размеченными или неразмеченными, а также от задачи, которую ты пытаешься решить, и твоих потребностей в развертывании.

Если твоя цель — высокая точность и четко определенные выходные данные, контролируемое машинное обучение часто является лучшим выбором. Если ты исследуешь данные или работаешь без меток, неконтролируемое обучение может быть более подходящим.

Хочешь узнать больше об ИИ? Загляни в наше community и GitHub repository. Изучи наши страницы с решениями, чтобы узнать об AI in robotics и computer vision in agriculture. Ознакомься с нашими вариантами лицензирования и начни создавать свои проекты в области компьютерного зрения уже сегодня!

Explore solutions

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Изучение обучения с учителем и без учителя в компьютерном зрении

Link to this sectionКак подходы к обучению ИИ расширяют возможности компьютерного зрения#

Link to this sectionВзгляд на использование моделей контролируемого обучения в компьютерном зрении#

Link to this sectionПонимание необходимости моделей неконтролируемого обучения в ИИ зрения#

Link to this sectionКак работает неконтролируемое обучение в компьютерном зрении#

Link to this sectionСамообучающееся и полуконтролируемое обучение в компьютерном зрении#

Link to this sectionОсновные различия между контролируемым и неконтролируемым обучением#

Link to this sectionКогда следует использовать контролируемое обучение в компьютерном зрении#

Link to this sectionПримеры контролируемого компьютерного зрения в реальном мире#

Link to this sectionКакие проблемы в компьютерном зрении может решить неконтролируемое обучение#

Link to this sectionПримеры неконтролируемого обучения в компьютерном зрении в реальном мире#

Link to this sectionПрактические ограничения контролируемого и неконтролируемого обучения#

Link to this sectionОсновные выводы#

Explore solutions

ИИ в робототехнике

ИИ в логистике

ИИ в розничной торговле

ИИ в здравоохранении

ИИ в производстве

ИИ в автомобильной отрасли

ИИ в сельском хозяйстве

ИИ в робототехнике

ИИ в логистике

ИИ в розничной торговле

ИИ в здравоохранении

ИИ в производстве

ИИ в автомобильной отрасли

ИИ в сельском хозяйстве

ИИ в робототехнике

ИИ в логистике

ИИ в розничной торговле

ИИ в здравоохранении

ИИ в производстве

ИИ в автомобильной отрасли

ИИ в сельском хозяйстве

Давай строить будущее ИИ вместе!