Глоссарий

Контрастное обучение

Откройте для себя мощь контрастивного обучения, метода самообучения для надежного представления данных с минимальным количеством размеченных данных.

Контрастное обучение — это метод машинного обучения, который обучает модель различать похожие и непохожие вещи. Вместо того чтобы учиться предсказывать метку по одной точке данных, модель учится, сравнивая пары примеров. Основная идея состоит в том, чтобы научить модель сближать представления похожих (положительных) пар в пространстве признаков, одновременно раздвигая представления непохожих (отрицательных) пар. Этот подход очень эффективен для изучения значимых представлений из больших немаркированных наборов данных, что делает его мощным методом в рамках более широкой категории самообучения.

Как это работает?

Процесс контрастивного обучения вращается вокруг создания положительных и отрицательных примеров. Для заданной точки данных, называемой «якорем», модель обучается следующим образом:

Положительные пары: Положительная пара состоит из якоря и точки данных, семантически похожей на него. В компьютерном зрении (CV) положительный пример часто создается путем применения сильной аугментации данных (например, случайной обрезки, поворота или изменения цвета) к якорному изображению. И якорь, и дополненная версия считаются положительной парой, поскольку они происходят из одного и того же исходного изображения.
Отрицательные пары: Отрицательная пара состоит из якоря и точки данных, которые не похожи друг на друга. В типичной настройке все остальные изображения в пакете обучения рассматриваются как отрицательные примеры.
Цель обучения: Модель, часто сверточная нейронная сеть (CNN), обрабатывает эти пары и оптимизируется с использованием контрастной функции потерь, такой как InfoNCE или Triplet Loss. Эта функция потерь штрафует модель, когда отрицательные пары находятся слишком близко или положительные пары находятся слишком далеко друг от друга в пространстве вложений. Знаковые исследовательские работы, такие как SimCLR и MoCo, значительно продвинули эти методы.

Применение в реальном мире

Контрастное обучение превосходно подходит для предварительного обучения моделей, позволяя им изучать мощные представления признаков, которые затем можно точно настроить для конкретных задач.

Визуальный поиск и поиск изображений: В электронной коммерции пользователь может захотеть найти продукты, визуально похожие на загруженное им изображение. Модель, предварительно обученная с помощью контрастного обучения, может сопоставлять изображения с векторным пространством, где похожие элементы сгруппированы вместе. Это обеспечивает эффективный семантический поиск и системы рекомендаций, которые имеют решающее значение для улучшения качества обслуживания клиентов в ИИ в розничной торговле.
Предварительное обучение для последующих задач: Модели, такие как Ultralytics YOLO11, могут получить выгоду от предварительного обучения на больших неразмеченных наборах данных с использованием контрастных методов. Это помогает модели изучить надежные визуальные признаки до того, как она будет дообучена на меньшем размеченном наборе данных для таких задач, как детектирование объектов или сегментация экземпляров. Такой подход часто приводит к повышению производительности и более быстрой сходимости, особенно когда размеченных данных мало, что известно как обучение с малым количеством примеров.