用語集

コントラスト学習

コントラスティブ学習の力を発見しましょう。これは、最小限のラベル付きデータで、堅牢なデータ表現を実現する自己教師あり学習の手法です。

Contrastive Learningは、類似したものと類似していないものを区別するようにモデルをトレーニングする機械学習手法です。モデルは、単一のデータポイントからラベルを予測することを学習する代わりに、例のペアを比較することによって学習します。中心となるアイデアは、類似（ポジティブ）なペアの表現を特徴空間内で互いに引き寄せ、類似していない（ネガティブ）ペアの表現を互いに遠ざけるようにモデルを教えることです。このアプローチは、ラベル付けされていない大規模なデータセットから意味のある表現を学習するのに非常に効果的であり、自己教師あり学習のより広範なカテゴリ内で強力な方法となっています。

その仕組み

コントラスト学習のプロセスは、ポジティブサンプルとネガティブサンプルの作成を中心に展開します。与えられたデータポイント（「アンカー」と呼ばれる）に対して、モデルは次のようにトレーニングされます。

ポジティブペア: ポジティブペアは、アンカーと、それと意味的に類似したデータポイントで構成されます。コンピュータビジョン（CV）では、ポジティブサンプルは、多くの場合、アンカー画像に強力なデータ拡張（ランダムなクロップ、回転、またはカラージッターなど）を適用することによって作成されます。アンカーと拡張バージョンの両方が同じソース画像から派生しているため、ポジティブペアと見なされます。
ネガティブペア: ネガティブペアは、アンカーと類似していないデータポイントで構成されます。一般的な設定では、トレーニングバッチ内の他のすべての画像がネガティブサンプルとして扱われます。
トレーニングの目的：モデル（多くの場合、畳み込みニューラルネットワーク（CNN））は、これらのペアを処理し、InfoNCEやTriplet Lossのようなコントラスト損失関数を使用して最適化されます。この損失関数は、ネガティブペアが近すぎる場合、またはポジティブペアが埋め込み空間内で離れすぎている場合に、モデルにペナルティを科します。SimCLRやMoCoのような画期的な研究論文は、これらの技術を大幅に進歩させました。

実際のアプリケーション

Contrastive Learningは、特定のタスクに合わせて微調整できる強力な特徴表現を学習するために、モデルを事前トレーニングするのに優れています。

Visual Searchと画像検索: Eコマースでは、ユーザーはアップロードした画像と視覚的に類似した製品を見つけたい場合があります。コントラスト学習で事前トレーニングされたモデルは、類似したアイテムが一緒にクラスタリングされるベクトル空間に画像をマッピングできます。これにより、効率的なセマンティック検索とレコメンデーションシステムが可能になり、小売におけるAIの顧客体験を向上させるために不可欠です。
ダウンストリームタスクのための事前トレーニング:Ultralytics YOLO11のようなモデルは、コントラスト法を使用して、ラベル付けされていない大規模なデータセットで事前トレーニングを行うことでメリットが得られます。これにより、ファインチューニングされる前に、モデルがロバストな視覚的特徴を学習するのに役立ちます。オブジェクト検出やインスタンスセグメンテーションのようなタスクのために、より小さいラベル付きデータセットで学習します。このアプローチは、特にラベル付きデータが不足している場合に、より優れたパフォーマンスとより速い収束につながることが多く、これはFew-Shot Learningとして知られる概念です。

Contrastive Learningとその他のパラダイムの比較

コントラスティブ学習を関連するパラダイムと区別すると理解しやすくなります。

教師あり学習: 物体検出タスクのバウンディングボックス付き画像など、細心の注意を払ってラベル付けされたデータに完全に依存します。対照的に、対照学習はデータ自体から独自の教師信号を生成するため、手動でのデータラベリングの必要性を大幅に削減します。
教師なし学習: これは、ラベルなしデータに隠されたパターンを見つけることを目的とした広範なカテゴリです。contrastive learningは、従来の教師なし学習手法（例：k-meansクラスタリング）のようにラベルなしデータを使用しますが、学習プロセスをガイドするために、教師ありのような目的（ペアを比較するというpretext task）を作成するため、区別されます。
自己教師あり学習（SSL）: Contrastive Learningは、主要なタイプのSSLです。SSLは、教師データがデータ自体から生成されるパラダイムです。Contrastive Learningはこれを実現する1つの方法ですが、画像のマスクされた部分を予測するなど、他の非Contrastive LearningのSSL手法も存在します。

利点と課題

利点:

ラベル依存性の軽減：ラベルなしの大量のデータを活用することで、コストと時間のかかるデータアノテーションの必要性を減らします。
ロバストな表現: 純粋な教師あり学習法と比較して、多くの場合、邪魔な変動に対してより不変な特徴を学習します。
効果的な事前学習: 特定のダウンストリームタスクでファインチューニングを行うための優れた開始点を提供し、特にラベル付きデータが限られている場合に、より良いパフォーマンスにつながることがよくあります。事前学習済みモデルがカスタムモデルのトレーニングでどのように使用されているかを確認できます。

課題:

ネガティブサンプル選択： パフォーマンスは、ネガティブサンプルの数と品質に左右される可能性があります。有益なネガティブサンプルを選択することは非常に重要ですが、困難です。
拡張戦略： データ拡張技術の選択は、モデルが学習する不変性に大きく影響します。
計算コスト: 効果的なトレーニングには、多くの場合、大きなバッチサイズとかなりの計算リソース（GPU）が必要ですが、これを軽減するための研究が進行中です。Ultralytics HUBのようなプラットフォームは、これらのモデルの管理とトレーニングを容易にすることができます。PyTorch（公式サイト）やTensorFlow（公式サイト）のようなフレームワークは、コントラスト学習法を実装するためのツールを提供します。

コントラスト学習

Ultralytics YOLOモデルをトレーニングして、業界全体のワークフローを効率化

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOでAIモデルを数秒でトレーニング

その仕組み

実際のアプリケーション

Contrastive Learningとその他のパラダイムの比較

利点と課題

このカテゴリの関連記事

ExecuTorch統合を使用してUltralytics YOLOモデルを展開する

PyTorchカンファレンス2025におけるウルトラリティクスの主なハイライト

自己教師付き学習による画像のノイズ除去

Ultralyticsコミュニティに参加しませんか？