CNNから実世界のAI活用まで、画像classifyの基礎を探ります。Ultralytics YOLO26を使用して、最先端のclassifierをトレーニングし、デプロイする方法を学びましょう。
画像分類は、コンピュータービジョン (CV)における基礎的なタスクであり、機械学習モデルが画像全体を分析し、事前定義されたカテゴリセットから単一のラベルを割り当てます。本質的に、「この写真の主な被写体は何ですか?」という問いに答えるものです。人工知能 (AI)の中核コンポーネントとして、このプロセスにより、自動化されたシステムが視覚データを大規模に整理、分類、解釈できるようになります。人間の目には単純に見えるかもしれませんが、コンピューターがパターンを認識できるようにするには、生のピクセルと意味のある概念との間のギャップを埋めるための洗練された機械学習 (ML)アルゴリズムが必要です。
現代の画像分類は、畳み込みニューラルネットワーク (CNN)として知られる深層学習 (DL)アーキテクチャに大きく依存しています。これらのネットワークは、生物学的視覚野が情報を処理する方法を模倣するように設計されています。特徴抽出と呼ばれるプロセスを通じて、モデルは初期層でエッジやテクスチャのような低レベルの属性を識別することを学習し、最終的にはそれらを組み合わせて深層層で複雑な形状や物体を認識します。
分類器を構築するため、開発者は教師あり学習を使用し、ラベル付きの例を含む膨大な量の訓練データをモデルに供給します。ImageNetのような大規模な公開データセットは、これらのシステムの精度向上に貢献してきました。推論フェーズでは、モデルは各カテゴリの確率スコアを出力し、多くの場合、ソフトマックス関数を利用して最も可能性の高いクラスを決定します。
画像分類と関連するコンピュータビジョン機能を区別することが重要です。技術の選択は特定の問題に依存するためです。
画像分類は、多様な産業にわたる幅広い実世界のAIアプリケーションを支えています。
医療分野では、分類モデルが診断スキャンを分析することで放射線科医を支援します。 医用画像解析ツールは、X線やMRIを「正常」または「異常」に迅速に分類したり、 腫瘍検出などの特定の状態を特定したりすることができ、 これにより、患者のトリアージと診断が迅速化されます。
工場では、製品基準を維持するために自動外観検査を利用しています。組み立てライン上のカメラが部品の画像を撮影し、分類モデルは目に見える欠陥に基づいてそれらを即座に「合格」または「不合格」とclassifyします。この自動化された品質管理により、欠陥のないアイテムのみが梱包段階に到達することが保証されます。
農家は、作物の健康状態を監視するために農業AIを活用しています。ドローンやスマートフォンで撮影された画像をclassifyすることで、システムは病気、栄養不足、害虫の発生の兆候を特定し、的を絞った精密農業介入を可能にします。
Ultralytics YOLO26フレームワークは、detectで有名ですが、画像分類タスクにおいて最先端のパフォーマンスを提供します。そのアーキテクチャは速度と精度に最適化されており、リアルタイムアプリケーションに適しています。
を使用して、事前学習済みモデルをロードし、画像をclassifyする方法の簡潔な例です。
ultralytics Python パッケージ:
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Run inference on an image source
results = model("https://ultralytics.com/images/bus.jpg")
# Print the top predicted class name
print(f"Prediction: {results[0].names[results[0].probs.top1]}")
ワークフローを合理化したいチームにとって、Ultralytics Platformはパイプライン全体を簡素化します。これにより、ユーザーは広範なコーディングインフラストラクチャなしで、分類データセットを管理し、クラウドベースのトレーニングを実行し、ONNXやTensorRTなどのさまざまな形式にモデルをデプロイできます。

未来の機械学習で、新たな一歩を踏み出しましょう。