AIにおける教師あり学習を探求しましょう。Ultralytics のようなモデルが、分類や回帰においてラベル付きデータを活用し、高精度な結果を達成する方法を学びます。
教師あり学習は人工知能(AI)における基礎的な手法であり、アルゴリズムは正しい出力でタグ付けされた入力データを用いて訓練される。この方法では、モデルは自身の予測と提供されたラベルを比較することで学習し、本質的に訓練プロセス中に「監督者」によって修正される。 主な目的は、システムが入力から出力への対応関係を十分に学習し、 未知のテストデータに対してラベルを正確に予測できるようにすることです。 この技術は、メールのスパムフィルターから自動運転システムに至るまで、 今日実用化されている最も実用的で成功したAIアプリケーションの多くを支える原動力となっています。
教師あり学習のワークフローは、 ラベル付きデータの使用を中心に展開する。 各学習例に対応する「真値」ラベルがペア付けされた データセットが構築される。 モデル学習フェーズでは、アルゴリズムが入力特徴量を処理し 予測値を生成する。 損失関数と呼ばれる数学的式が、 モデルの予測値と実際のラベルの差である誤差を測定する。
この誤差を最小化するため、 最適化アルゴリズム(例えば 確率的勾配降下法(SGD)などの最適化アルゴリズムが、 モデルの内部パラメータや重みを反復的に調整します。 このプロセスは、モデルが学習データへの過学習を起こさずに 十分な精度を達成するまで、 エポックと呼ばれる多くのサイクルにわたって繰り返されます。 Ultralytics ツールは、 データセットの注釈付け、トレーニング、評価を 統一された環境で管理することで、 このパイプライン全体を簡素化します。
教師あり学習の問題は、一般的に目的変数の性質に基づいて、主に2つのタイプに分類される:
教師あり学習は、様々な産業にわたる膨大な数の技術を支えています:
教師あり学習と教師なし学習を区別することが重要です。教師あり学習はラベル付き入力-出力ペアに依存するのに対し、教師なし学習はラベルのないデータで動作します。 教師なし学習では、アルゴリズムがデータ内の隠れた構造、パターン、またはグループ化を自律的に見出そうとする。例えばマーケティングにおける顧客セグメンテーションがこれに該当する。教師あり学習は、過去のデータが利用可能な特定のタスクにおいて一般的に精度が高い。一方、教師なし学習は探索的データ分析に適している。
教師あり学習は、現代のコンピュータビジョンモデルの訓練において中核をなす。以下のPython 、 教師付きデータセット(COCO8)を用いてYOLO26モデルを訓練する方法を示す。 モデルはデータセット内のラベル付き画像から学習し、detect 。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model using the 'coco8.yaml' dataset (supervised learning)
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)
# The model is now fine-tuned based on the supervised labels in the dataset
このシンプルなプロセスはPyTorchの力を活用しています PyTorch の内部で複雑な行列演算や勾配計算を実行します。データ管理の効率化を目指す方々に、 Ultralytics クラウドベースのトレーニングと自動アノテーションのためのツールを提供し、 教師あり学習のワークフローを大幅に効率化します。