YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

半教師あり学習

半教師あり学習が、ラベル付きデータとラベルなしデータを組み合わせてAIモデルを強化し、ラベル付けコストを削減し、精度を向上させる仕組みをご覧ください。

準教師あり学習(SSL)は、機械学習(ML)の手法の一つで、教師あり学習教師なし学習のギャップを埋めるものです。少量のラベル付きデータと大量のラベルなしデータを活用して、学習精度を向上させます。多くの現実的なシナリオでは、ラベルなしデータの取得は安価ですが、データラベリングのプロセスはコストがかかり、時間がかかります。SSLは、より小さなラベル付きセットによって提供される構造と情報に基づいて、膨大なラベルなしの例からモデルが学習できるようにすることで、この課題に対応します。このアプローチは、モデルが高いパフォーマンスを達成するために膨大なデータセットを必要とする深層学習(DL)において特に強力です。

半教師あり学習はどのように機能するか

SSLの基本的な考え方は、ラベル付きデータを使用して初期モデルを構築し、このモデルを使用してラベルなしデータに対する予測を行うことです。モデルの最も信頼性の高い予測は、「疑似ラベル」として扱われ、トレーニングセットに追加されます。次に、モデルは、元のラベルと信頼性の高い疑似ラベルのこの組み合わせで再トレーニングされます。この反復プロセスにより、モデルは、小さなラベル付き部分だけでなく、データセット全体の基になる構造を学習できます。

一般的なSSL技術には以下が含まれます。

  • 整合性正則化: この方法は、入力データがわずかに摂動された場合でも、モデルの予測が一貫性を保つべきであるという考えを強制します。例えば、わずかなデータ拡張を伴う画像は、同じ分類をもたらすはずです。
  • Generative Models: 敵対的生成ネットワーク(GAN)のような手法は、真のデータ分布に類似したデータを生成することを学習し、クラス間の決定境界をより明確に定義するのに役立ちます。
  • グラフベースの手法: これらの手法は、データポイントをグラフ内のノードとして表現し、ラベル付きノードからラベルなしノードに、それらの近接性または類似性に基づいてラベルを伝播します。技術的な概要は、学術調査に記載されています

実際のアプリケーション

SSLは、ラベル付けがボトルネックとなっている分野で非常に効果的です。2つの顕著な例を次に示します。

  1. 医用画像解析: 腫瘍検出のためにMRIやCTのような医療スキャンにラベルを付けるには、専門の放射線科医が必要で、非常に高価です。SSLを使用すると、数百のラベル付きスキャンでモデルをトレーニングし、病院のアーカイブから数千のラベルなしスキャンを使用して改良することができます。これにより、手作業を大幅に減らしながら、ロバストな画像分類と セグメンテーションモデルを開発することができる。
  2. ウェブコンテンツとドキュメントの分類: 何十億ものウェブページ、ニュース記事、または顧客レビューを手動で分類することは現実的ではありません。SSLは、手動で分類された少量のドキュメントセットを使用して、初期テキスト分類器をトレーニングできます。その後、モデルはラベル付けされていない大量のドキュメントコーパスを分類し、センチメント分析やトピックのカテゴリ分けなどのタスクで、独自の予測を使用して時間の経過とともに改善します。

他の学習パラダイムとの比較

SSLを関連する人工知能(AI)の概念と区別することが重要です。

  • 自己教師あり学習 (SSL):同じ頭字語だが、自己教師あり学習は異なる。これは教師なし学習の一種であり、ラベルは事前のタスク(例えば、文中のマスクされた単語を予測する)を通じてデータ自体から生成される。半教師あり学習では、モデルの学習プロセスを導くために、少量の明示的にラベル付けされたデータセットが必要になる。
  • アクティブ・ラーニング:この手法もラベル付けコストの削減を目的としている。しかし、能動学習モデルは、ラベル付けされていないデータをすべて使用するのではなく、最も情報量の多いデータ点にラベル付けするよう、人間の注釈者にインテリジェントに問い合わせる。対照的に、SSLは通常、学習中に人間との直接的なインタラクションなしにラベル付けされていないデータを利用する。
  • トランスファー・ラーニング:これは、(ImageNetのような)大規模なデータセットで事前に訓練されたモデルを使用し、より小規模でタスクに特化したデータセットで微調整を行う。どちらも既存の知識を活用するが、SSLは対象タスクのラベルなしデータそのものから学習するのに対し、転移学習は別の(多くの場合関連する)タスクの知識を活用する。

ツールとトレーニング

PyTorchPyTorch公式サイト)やTensorFlowTensorFlow公式サイト)を含む多くの最新の深層学習(DL)フレームワークは、SSLアルゴリズムを実装するための機能を提供するか、または適合させることができます。Scikit-learnのようなライブラリは、いくつかのSSLメソッドを提供しますUltralytics HUBのようなプラットフォームは、ラベル付きデータとラベルなしデータの混合物を含む可能性のあるデータセットの管理を容易にすることでプロセスを効率化し、そのようなデータ構造を活用するように設計されたモデルのトレーニングデプロイメントを簡素化します。SSLの研究は進化し続けており、その貢献はNeurIPSICMLのような主要なAI会議で発表されることがよくあります。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました