YOLO Vision Shenzhen
深セン
今すぐ参加
用語集

半教師あり学習

半教師あり学習がラベル付きデータとラベルなしデータを組み合わせてモデル精度をどのように向上させるかを探ります。Ultralytics YOLO26を使用してSSLワークフローを実装する方法を学びましょう。

半教師あり学習 (SSL) は、2つの従来の学習手法の橋渡しをする機械学習 (ML)における戦略的なパラダイムです。教師あり学習が完全にアノテーションされたデータセットに依存し、教師なし学習がタグなしデータ内のパターンを見つけようとするのに対し、SSLは少量のラベル付きデータと、はるかに大量のラベルなしデータを組み合わせることで機能します。このアプローチは、防犯カメラや衛星からのビデオ映像のような生の画像を収集することは比較的安価であるものの、人間によるデータラベリングのプロセスが高価で時間がかかり、労働集約的である現実世界のコンピュータビジョン (CV)シナリオにおいて特に価値があります。ラベルなしの例に隠された構造を効果的に利用することで、SSLは網羅的なアノテーション予算を必要とせずに、モデルの精度と汎化性能を大幅に向上させることができます。

半教師あり学習の主要なメカニズム

SSLの主な目標は、少数のラベル付きサンプルから得られた情報を、より大規模なラベルなしサンプルセットに伝播することです。これにより、ニューラルネットワークはデータの低密度領域を通過する決定境界を学習し、より堅牢な分類またはdetectを可能にします。

ほとんどの半教師ありワークフローを推進する2つの一般的な手法:

  • 擬似ラベリング: この手法では、まず限られたラベル付きデータでモデルをトレーニングします。次に、ラベルなしデータに対して推論を実行するために使用されます。特定の信頼度しきい値を超える予測は、「擬似ラベル」または「グラウンドトゥルース」として扱われます。これらの信頼性の高い予測はトレーニングデータに追加され、モデルは再トレーニングされ、そのパフォーマンスを反復的に向上させます。
  • 一貫性正則化: この手法はデータ拡張に依存します。その考え方は、モデルが画像とそのわずかに変更された(拡張された)バージョンに対して同様の予測を出力すべきであるというものです。オリジナルバージョンと拡張バージョン間の予測の差を最小限に抑えることで、モデルはノイズではなくオブジェクトのコア機能に焦点を当てることを学習し、過学習に対処する能力を向上させます。

YOLOを用いた実践的実装

以下のpythonの例は、ultralyticsパッケージを使用したシンプルな擬似ラベリングワークフローを示しています。ここでは、小さなデータセットでYOLO26モデルをトレーニングし、それを使用してラベル付けされていない画像のディレクトリのラベルを生成します。

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train initially on a small available labeled dataset
model.train(data="coco8.yaml", epochs=10)

# Run inference on unlabeled data to generate pseudo-labels
# Setting save_txt=True saves the detections as text files for future training
results = model.predict(source="./unlabeled_images", save_txt=True, conf=0.85)

実際のアプリケーション

半教師あり学習は、データは豊富にあるが専門知識が不足している産業を変革しています。

  • 医療画像: ヘルスケアAIにおいて、スキャン(X線、MRI)の取得は標準的な手順ですが、腫瘍detectのために認定放射線科医がすべてのピクセルにアノテーションを付けることは非常に高価です。SSLは、研究者が専門家がアノテーションを付けた症例のごく一部のみを使用して高性能モデルを訓練することを可能にし、何千ものアーカイブされたスキャンを活用して生物学的構造に対するモデルの理解を洗練させます。
  • 自動運転: 自動運転車企業は、フリート車両から毎日ペタバイト規模の動画データを収集しています。オブジェクト検出セマンティックセグメンテーションのためにすべてのフレームにラベル付けすることは不可能です。SSLを通じて、システムはラベル付けされていない膨大な走行時間から学習し、複雑な道路環境、気象条件、稀なエッジケースをより良く理解することができます。

関連概念の区別

AIソリューションを効果的にデプロイするには、SSLが類似の戦略とどう異なるかを理解することが不可欠です。

  • vs. Active Learning: どちらもラベルなしデータを扱いますが、ラベリングへのアプローチは異なります。SSLはモデルの予測に基づいて自動的にラベルを割り当てます。対照的に、アクティブラーニングは最も「混乱しやすい」または不確実なデータポイントを特定し、明示的にヒューマン・イン・ザ・ループにそれらをラベル付けするよう要求することで、人間が費やす時間を最適化し、完全に排除するわけではありません。
  • vs. 転移学習: 転移学習は、大規模な外部データセット(ImageNetなど)で事前訓練されたモデルを取得し、特定のタスクに合わせてファインチューニングすることを含みます。しかし、SSLは訓練プロセス自体において、特定のデータセット分布のラベルなし部分を活用することに焦点を当てています。
  • vs. 自己教師あり学習: 名前は似ていますが、自己教師あり学習は、データが外部ラベルなしで独自の教師信号を生成する「プレテキストタスク」(画像パッチのジグソーパズルを解くなど)を指すことがよくあります。SSLは、プロセスをガイドするために、より小さな検証済みラベルセットを使用することを具体的に意味します。

ツールと今後の展望

深層学習(DL)モデルの規模が拡大するにつれて、データ利用の効率性が極めて重要になります。PyTorchTensorFlowのような最新のフレームワークは、これらの高度なトレーニングループのための計算バックエンドを提供します。さらに、Ultralytics Platformのようなツールは、データセット管理のライフサイクルを簡素化しています。自動アノテーションのような機能を活用することで、チームは半教師ありワークフローをより容易に実装し、生データを迅速に本番環境対応のモデルウェイトに変換できます。このMLOpsの進化により、高精度なビジョンシステムを構築するための参入障壁は引き続き低くなっています。

共にAIの未来を築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。