YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

画像分類

Ultralytics YOLOによる画像分類について学びましょう。最先端のツールを使用して、医療、農業、小売などの分野向けにカスタムモデルをトレーニングできます。

画像分類は、コンピュータビジョン(CV)における基本的なタスクであり、定義済みのカテゴリセットから、画像全体に単一の特定のラベルを割り当てることを伴います。主な目標は、画像の主要な被写体を識別し、それに応じて分類することです。たとえば、分類モデルは画像を分析し、「猫」、「犬」、「車」のようなラベルを出力します。このタスクは、より複雑なCVアプリケーションの基礎を形成し、機械学習(ML)のコアコンポーネントです。このプロセスは、アルゴリズム、特に畳み込みニューラルネットワーク(CNN)に依存して、ラベル付けされた大規模なデータセットから識別機能を学習します。

画像分類の仕組み

画像分類モデルは、教師あり学習を使用してトレーニングされます。ここでは、正しいクラスで手動でラベル付けされた膨大な数の画像が供給されます。トレーニング中、ニューラルネットワークは、各カテゴリに関連付けられたパターン、テクスチャ、形状、および色の組み合わせを学習します。この学習は、バックプロパゲーションと呼ばれるプロセスを通じて実現されます。これは、モデルの予測と実際のラベルの間の差を最小限に抑えるために、モデルの内部パラメータ、つまり重みを調整します。

最新の分類モデルでは、多くの場合、多層の深層学習アーキテクチャが使用されます。初期の層はエッジやコーナーのような単純な特徴を認識するように学習し、より深い層はそれらを組み合わせて目、車輪、顔のようなより複雑な構造を識別します。ネットワークの最終層は通常、ソフトマックス関数を使用して、考えられる各クラスの確率スコアを生成します。最も高い確率を持つクラスが最終的な予測として選択されます。このプロセスで重要なのは特徴抽出であり、モデルは分類タスクに最も有益な特徴を自動的に学習します。

画像分類の応用

画像分類は、視覚認識タスクを自動化および拡張するために、多くの業界で使用されています。2つの顕著な例を以下に示します。

  1. 医用画像解析: ヘルスケアにおいて、分類モデルは X 線、MRI、CT スキャンなどの医用画像を解析して、放射線科医による疾患の検出を支援します。例えば、モデルは数千枚のマンモグラムで学習し、画像を「良性」または「悪性」として分類し、乳がんの早期発見を支援します。これにより、診断が迅速化され、人的エラーが削減されます。詳細については、米国癌協会によるがん検出における AI の概要をご覧ください。
  2. 農業技術: 農家は、ドローンや衛星から撮影された画像から作物の健康状態を監視するために、画像分類を使用します。モデルは、植物の葉の画像を「健康」、「病気」、「害虫被害」などのカテゴリに分類できます。これにより、農薬や肥料の的を絞った施用が可能になり、作物の収量が増加し、持続可能な農業が促進されます。Ultralyticsがどのように農業におけるAIをサポートしているかについて、詳しくはこちらをご覧ください。

画像分類と関連タスク

画像分類は他のコンピュータビジョンタスクと密接に関連していますが、明確な目的があります。以下と区別することが重要です。

  • 物体検出: このタスクは、分類よりもさらに一歩進んだものです。画像全体に1つのラベルを割り当てる代わりに、物体検出では画像内の複数の物体を識別し、それぞれの周りにバウンディングボックスを描画し、各ボックスにクラスラベルを割り当てます。たとえば、「街の風景」という画像をラベル付けするだけでなく、「車」、「歩行者」、「信号機」といった個々の物体を特定して分類します。
  • 画像セグメンテーション: このタスクは、各ピクセルを分類することにより、画像の最も詳細な理解を提供します。異なるタイプがあり、セマンティックセグメンテーション(すべてのピクセルを車に属するものとして1つの色にするなど)と、同じオブジェクトの異なるインスタンスを区別するインスタンスセグメンテーション(各車が異なる色であるなど)が含まれます。このレベルの詳細は、自動運転車などのアプリケーションに不可欠です。

まとめると、分類は画像にがあるかを伝え、検出はどこにあるかを伝え、セグメンテーションはシーン内のすべてのものの詳細なピクセルレベルのマップを提供します。

Ultralyticsによる画像分類

Ultralytics YOLOモデルは、物体検出で有名ですが、画像分類タスクにも優れています。YOLOv8のような最先端モデルは、直感的なUltralytics PythonパッケージまたはノーコードのUltralytics HUBプラットフォームを使用して、カスタムデータセットで簡単に学習またはファインチューニングできます。

ドキュメントには、モデルの学習に関するヒントや、YOLO11を画像分類に使用する方法に関する詳細なガイドなど、豊富なリソースが用意されています。開発者は、ImageNetCIFAR-100Caltech-101などのベンチマークデータセットで事前学習済みのモデルを活用したり、新しいモデルをスクラッチから学習したりできます。最新の進歩に関心のある方には、Papers With Codeのようなリソースが、トップパフォーマンスのモデルの包括的な概要を提供します。また、標準的なベンチマークでYOLOモデルのパフォーマンスを比較することもできます。PyTorchTensorFlowのようなフレームワークは、これらのモデルを構築および学習するための基盤を提供します。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました