Yolo 深圳
深セン
今すぐ参加
用語集

半教師あり学習

半教師あり学習が、ラベル付きデータとラベルなしデータを組み合わせてAIモデルを強化し、ラベル付けコストを削減し、精度を向上させる仕組みをご覧ください。

半教師付き学習(SSL)は、機械学習(ML)における強力なパラダイムである。 機械学習(ML)における強力なパラダイムである。 完全教師あり学習と教師なし学習の 教師なし学習。教師あり 教師あり学習は完全な注釈付きデータセットを必要とし、教師なし学習はラベルなしで動作する。 SSLは、少量のラベル付きデータと、より大量のラベルなしデータを活用することで動作する。多くの実世界では 実世界の多くのシナリオでは、未加工データの入手は比較的安価だが、データのラベル付けプロセスは高価で時間もかかる。 データ・ラベリングのプロセスは高価で時間がかかり、人間の専門知識を必要とする。 人間の専門知識が必要である。SSLはこのボトルネックに対処するため、限られたラベル付き例を学習プロセスのガイドとして使用する。 これにより、モデルはラベル付けされていない膨大なセグメントから構造とパターンを抽出し、モデル全体の精度と汎化を向上させることができる。 モデル全体の精度と汎化を向上させます。

半教師あり学習はどのように機能するか

SSLの基本的なメカニズムは、ラベル付けされたデータからラベル付けされていないデータに情報を伝播することである。このプロセスは このプロセスは一般的に、小さなラベル付きデータセットで初期モデルを学習することから始まる。このモデルは、ラベル付けされていないデータ を推論するために使用される。最も信頼できる予測-しばしば擬似ラベルと呼ばれる-は、グランドトゥルースとして扱われる。 として扱われ、モデルはこの拡張データセットで再学習される。この反復サイクルによって ニューラルネットワークは を学習することができる。

SSLで使用される一般的なテクニックには、以下のようなものがある:

  • 擬似ラベリング:モデルはラベル付けされていないデータに対してラベルを生成し、信頼度の高い予測を学習データに追加する。 学習データに追加する。これはしばしば 信頼度しきい値と併用される。
  • 一貫性正則化:この方法は、元の画像と摂動が加えられた画像(摂動が加えられた後の画像)に対して、モデルが同じ予測を行うよう促します。 この方法は、モデルが元の画像と(例えばデータ補強を適用した後の)摂動バージョンに対して同じ予測を生成するよう促します。 データ補強を適用した後など)。モデルが が物体を理解していれば、画像を反転させたり少し回転させたりしても分類は変わりません。一貫性正則化の概念については 一貫性正則化の概念については、学術文献を参照してください。
  • グラフベースの手法:データ点はグラフのノードとして表現され、エッジは類似性を反映する。 エッジは類似性を反映する。ラベルはラベル付けされたノードからラベル付けされていない隣接ノードに伝搬される。 グラフ・ニューラル・ネットワーク(GNN)の研究でよく議論される手法である。

実際のアプリケーション

半教師付き学習は、データは豊富だが専門家による注釈が乏しい業界において、特に大きな変革をもたらす。 乏しい業界では、半教師付き学習は特に大きな変革をもたらす。

  1. 医療画像解析:医療では ようなタスクのために 腫瘍検出 のようなタスクのためにラベル付けされたデータセットを生成するには、高給取りの放射線科医がMRIやCTスキャンに手作業で注釈を付ける必要があります。SSLを使えば、研究者はモデルを SSLを使えば、研究者は医師が検証したスキャン画像の小さなセットでモデルを訓練し、その後、何千もの注釈のない病院のアーカイブを活用してパフォーマンスを向上させることができる。 パフォーマンスを向上させることができる。これにより、高い診断基準を維持しながら、コストを大幅に削減することができます。 ヘルスケアにおけるAI
  2. 音声認識:特殊な音声アシスタントは大量の音声データを必要とする。しかし 何千時間もの音声を書き起こすことは現実的ではないが、技術企業は、ベースモデルを訓練するために、書き起こされた音声の小さなセットを使用することができる。 ベースモデルを学習させることができる。このモデルは次に、ウェブデータにある何百万時間もの書き起こされていない音声のニュアンスから学習する。 多様なアクセントや方言を理解する能力に磨きをかける。 自動音声認識

関連概念の区別

SSLを完全に理解するためには、類似の学習パラダイムと区別することが役に立つ:

  • SSLと自己教師あり学習の比較 自己教師あり学習 頭文字は同じだが、両者は異なる。自己教師あり学習は、データ構造から独自のラベルを作成する。 例えば、文中の次の単語や画像中の欠落したパッチを予測する)。 半教師あり学習は、人間が提供したラベルのシードセットに依存する。
  • SSLとアクティブラーニングの比較能動学習では 能動学習では、モデルはどのデータ点が最も紛らわしいかを特定し、明示的に人間にラベル付けを依頼する。 する。対照的にSSLは、ラベル付けされていないデータを、人間の入力のためにワークフローを中断することなく自動的に解決しようとする。 人間の入力。
  • SSLとトランスファー・ラーニング 転移学習は 元タスク(ImageNet)からモデルの重みを取り出し のような)ソースタスクからモデルの重みを取り出し、ターゲットタスク上で微調整する。SSLは、最初から学習を向上させるために、同じターゲット分布のラベルなしデータ SSLは、最初から学習を向上させるために、同じターゲット分布からラベル付けされていないデータを使用することに重点を置く。

実践的な実施

半教師付きワークフローを実装するには、しばしば「教師と生徒」のループや反復トレーニングが必要になる。以下は を使った概念的な例である。 ultralytics Python パッケージは、ラベル付けされていないデータをどのように推論し Pythonパッケージは、さらなる学習のための擬似ラベルとして機能する予測を生成するために、ラベル付けされていないデータを推論する方法を示す。

from ultralytics import YOLO

# Initialize the YOLO11 model (Teacher)
model = YOLO("yolo11n.pt")

# Train initially on a small, available labeled dataset
model.train(data="coco8.yaml", epochs=10)

# Run inference on a directory of unlabeled images to generate predictions
# These results can be filtered by confidence to create 'pseudo-labels'
results = model.predict(source="./unlabeled_data", save_txt=True, conf=0.8)

# The saved text files from prediction can now be combined with the original
# dataset to retrain a robust 'Student' model.

ツールと今後の展望

ディープラーニングフレームワーク PyTorchTensorFlowは、カスタムSSL ループと損失関数を実装するのに必要なビルディング・ブロックを提供する。モデルの規模が大きくなり、データを大量に消費するようになるにつれて、SSLのようなテクニックは、データ効率を最大化するための標準的なプラクティスになりつつある。 になってきている。

次期Ultralytics Platformは、このようなワークフローを合理化するように設計されています。 生データからモデル展開までの データキュレーションと 自動注釈プロセスを促進することで、チームが生データからモデル展開への移行を管理できるよう支援します。これにより ラベル付けされていないデータを効果的に活用することで、組織は以下のような高性能AIソリューションを展開することができます。 YOLO11のような高性能AIソリューションを、純粋に教師ありの手法に頼るよりも迅速かつ安価に導入することができる。 のような高性能AIソリューションを、より迅速に、より手頃な価格で導入することができる。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加