教師あり学習
教師あり学習がラベル付きデータでAIを強化し、正確な予測や物体検出や感情分析などのアプリケーションを可能にする方法をご覧ください。
教師あり学習は、機械学習(ML)における基本的なパラダイムであり、アルゴリズムが、正しい結果が手動でラベル付けされたデータから学習する。主な目標は、新しい未知のデータに対する出力を予測できるマッピング関数を学習することである。これは、学習段階で正しい答え(ラベル)を提供する教師、あるいは「スーパーバイザー」と一緒に学習することだと考えてほしい。このアプローチは、人工知能(AI)アプリケーション、特にコンピュータ・ビジョン(CV)の分野で成功する多くのバックボーンとなっている。
教師あり学習の仕組み
教師あり学習のプロセスは、入力特徴量と対応する出力ラベルを含むキュレーションされたデータセットから始まる。このラベル付きデータセットは、訓練データ、検証データ、テストデータに分割される。
- トレーニング:モデルには学習データが与えられる。各入力に対して予測を行い、正しいラベルと比較する。
- 誤差補正:モデルの予測と実際のラベルの差は、損失関数によって定量化される。勾配降下のような最適化アルゴリズムは、この誤差を最小化するためにモデルの内部パラメータ、つまりモデルの重みを調整する。
- 反復:このプロセスが何度も繰り返されることで、モデルはデータ内の基本的なパターンを学習する。モデルの性能は、オーバーフィッティングのような問題を防ぐために、検証セット上で監視される。
- 予測:いったん学習されると、モデルはラベル付けされていない新しいデータに対して予測を行うことができる。これらの予測の品質は、テスト・セットとパフォーマンス・メトリクスを用いて評価される。
このワークフロー全体は、Ultralytics HUBのようなプラットフォーム上で合理化され、データセットの管理、モデルのトレーニング、デプロイメントを簡素化します。
教師あり学習問題の種類
教師あり学習タスクは、一般的に大きく2つのタイプに分類される:
- 分類:目標は、個別のカテゴリーまたはクラス・ラベルを予測することである。例えば、画像分類モデルは画像を "猫 "か "犬 "かで分類するように学習される。その他の例としては、スパムメールの検出やセンチメント分析がある。Ultralytics YOLOのようなモデルは、高性能な分類タスクのためにトレーニングすることができます。さらに詳しくお知りになりたい方は、分類入門をご覧ください。
- 回帰:目標は連続的な数値を予測することである。例えば、家の大きさや立地などの特徴に基づいて、家の価格を予測するモデルがある。他のアプリケーションには、株価予測や気温予測などがあります。回帰の概要は、回帰分析ガイドにあります。
実世界での応用
教師あり学習は、数え切れないほどの最新のAIシステムを動かしている。ここに2つの顕著な例を挙げる:
- 自律走行車における物体検出:自動運転車は、歩行者、他の車両、交通標識を識別して位置を特定するために、物体検出モデルに依存している。これらのモデルは、画像内の物体にバウンディングボックスを付けてラベル付けした膨大なデータセットで学習される。訓練されたモデルは、リアルタイムのビデオフィードを処理して、重要な運転判断を下すことができます。Ultralyticsは、自動車産業におけるAIのための強力なソリューションを提供します。
- 医療画像解析:ヘルスケアでは、教師あり学習モデルは、MRIやCTスキャンにおける腫瘍の検出など、医療画像解析に使用される。放射線技師は大量のスキャン画像にラベルを付け、腫瘍の有無を示す。その後、畳み込みニューラルネットワーク(CNN)がこのデータで学習され、早期診断を支援する。例えば、脳腫瘍検出のためのデータセットでモデルを訓練することができる。
他の学習パラダイムとの比較
教師あり学習は、他の主要な機械学習パラダイムとは異なる:
- 教師なし学習:このアプローチでは、ラベル付けされていないデータを使用し、アルゴリズムは、類似したデータポイントのグループ化(クラスタリング)やデータの次元の削減など、パターンや構造を独自に見つけようとする。既知の答えから直接入出力マッピングを学習することはない。教師なし学習の概要を読む。
- 自己教師あり学習(SSL):教師なし学習のサブセットで、教師信号(ラベル)が入力データ自体から自動的に生成される。これは、特定のタスクのために微調整する前に、膨大な量のラベルなしデータで基礎モデルを事前学習するための強力な手法である。
- 強化学習:このパラダイムでは、エージェントは環境と相互作用し、その行動に基づいて報酬やペナルティを受け取ることで、一連の決定を行うことを学習する。静的でラベル付けされたデータセットからではなく、試行錯誤を通じて最適な行動を学習する。強化学習の概要を見る。
要約すると、教師あり学習は、予測タスクのモデルを訓練するためにラベル付きデータを活用する強力で広く使用されている技術です。教師あり学習は、Ultralyticsが開発・サポートするものを含め、多くの成功したAIアプリケーションのバックボーンを形成しており、データサイエンスやAIに携わる人にとって極めて重要なスキルです。