Yolo 深圳
深セン
今すぐ参加
用語集

教師あり学習

教師あり学習が、ラベル付きデータでAIを強化し、正確な予測や、物体検出、感情分析などのアプリケーションを可能にする仕組みをご覧ください。

教師あり学習は、機械学習(ML)の分野で支配的なパラダイムである。 機械学習(ML)の分野で支配的なパラダイムである。 正しい出力でラベル付けされた入力データで学習される。システムが自律的に システムが自律的にデータを探索する他の手法とは異なり、このアプローチは「スーパーバイザー」(ラベル付けされたデータ)に依存する。 ラベル付けされたデータが学習プロセスを導く。主な目的は 主な目的は、モデルが入力変数から出力変数へのマッピング関数を十分な精度で学習することである。 新しい未知のデータの結果を予測できるような精度で、入力変数から出力変数へのマッピング関数を学習することである。この手法は、多くの 商用 人工知能(AI) スパムフィルターから高度な コンピュータ・ビジョン(CV)システムに至るまで、多くの商用人工知能(AI)アプリケーションの基盤となっている。

プロセスの仕組み

ワークフローは、入力(特徴)と希望する出力(ラベル)のペアを含むデータセットから始まる。このコレクション は通常、異なるサブセットに分けられる: モデルをティーチングするための学習データ、パラメータをチューニングするための検証データ パラメータのチューニングのための検証データ、そして最終評価のためのテストデータです。 を評価する。

モデルの学習段階では、アルゴリズムは入力データを処理し、予測を行う。 入力データを処理し、予測を行います。損失関数として知られる数式は 損失関数として知られる数式が 予測値と実際のラベルの差を計算する。この誤差を最小化するために 最適化アルゴリズム 勾配降下法などの最適化アルゴリズムが、モデル内部の重みを繰り返し調整する。 モデルの重みを調整する。このサイクルは何度も繰り返される、 このサイクルは、モデルが学習セットにオーバーフィットすることなく、満足のいく性能を達成するまで、何度も繰り返される。 トレーニングセットにオーバーフィットすることなくより深く を参照してください。 を参照してください。

教師あり学習のコア・カテゴリー

教師あり学習問題の多くは、出力変数の種類によって2つの主要なカテゴリーに分類される:

  • 画像の分類出力変数は 出力変数はカテゴリまたはクラスです。例えば、ある電子メールが "スパム "か "スパムでない "か、あるいは写真に "猫 "か "犬 "が含まれているかどうかを判断することである。最新の のような最新のアーキテクチャは Ultralytics YOLO11のような最新のアーキテクチャーは のような最新のアーキテクチャーは、視覚データのパターンを迅速に特定することで、このような分類タスクを得意としている。
  • 回帰出力変数 出力変数は連続的な実数値である。例としては、面積に基づく不動産価格の予測や、株式市場の動向の予測などがある。 株式市場のトレンド予測などである。これらの手法の統計的基礎については IBMの回帰分析の概要です。

分類モデルの実装

教師ありモデルのトレーニングは、高レベルのAPIによってますますアクセスしやすくなっている。以下のPython 例 は、数字分類の標準的なベンチマークであるMNIST データセットでYOLO11 モデルを学習する方法を示しています。

from ultralytics import YOLO

# Load a pretrained classification model
model = YOLO("yolo11n-cls.pt")

# Train the model on the MNIST dataset
# Ultralytics handles the download of the 'mnist160' dataset automatically
results = model.train(data="mnist160", epochs=5, imgsz=64)

# Run inference on a sample image to verify the supervised learning
print(model("https://ultralytics.com/images/bus.jpg"))

実際のアプリケーション

教師あり学習は、さまざまな産業で重要な技術を支えている。代表的な例としては、以下の2つが挙げられる:

  1. 自律走行車 自動運転車は 教師あり学習 に依存している。歩行者、信号機、その他の車両の何千もの画像を含む注釈付きデータセットにより、自動車のAIはリアルタイムで危険を認識し、位置を特定することができる。 車のAIはリアルタイムで危険を認識し、場所を特定することができる。エヌビディアのような企業は NVIDIA 企業は、ディープラーニングを活用して、これらの膨大な センサー入力を処理し、安全なナビゲーションを実現する。
  2. 医療画像解析 医療分野では、専門家である放射線科医によってラベル付けされたスキャン画像に対してモデルを学習させ、診断を支援する。例えば モデルは、X線やMRIから病変の初期徴候を識別することを学習することができます。研究者はしばしば 脳腫瘍検出データセットのようなリソースを利用することが多い。 臨床的意思決定を支援するシステムを構築する。

関連概念の区別

教師あり学習を他の機械学習パラダイムと区別することは重要である:

  • 教師なし学習 教師あり学習とは異なり、この手法はラベル付けされていないデータを扱う。その目的は、以下のような隠れた構造を発見することである。 例えば、クラスター分析によって類似した購買習慣を持つ顧客をグループ化する クラスター分析
  • 強化学習 正解の静的データセットから学習する代わりに、エージェントは環境との相互作用によって学習する。エージェントは 報酬やペナルティの形でフィードバックを受け取る。 サットンとバルトの強化学習入門に詳しい。
  • 半教師あり学習 このアプローチは中間的な役割を果たし、学習効率を向上させるために、少量のラベル付けされたデータと、より多くのラベル付けされていないデータを併用する。 学習効率を向上させるために、ラベル付けされたデータとラベル付けされていないデータを併用する。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加