オブジェクト検出にUltralytics YOLO11を使用する方法
新しいUltralytics YOLO11モデルが、さまざまな業界のアプリケーション全体でより高い精度を達成するために、どのようにオブジェクト検出に使用できるかを探ります。

コンピュータビジョンは、AI(人工知能)の一分野であり、機械が視覚情報を解釈・理解することで、物体検出のような重要なタスクを実現します。画像分類とは異なり、物体検出は画像内にどのような物体があるかを特定するだけでなく、その正確な位置もピンポイントで特定します。これにより、自動運転車のようなビジョンAIアプリケーション、リアルタイムのセキュリティシステム、倉庫の自動化において欠かせないツールとなっています。
時が経つにつれ、物体検出技術はより高度で使いやすいものへと進化してきました。大きな進歩として、Ultralyticsの年次ハイブリッドイベントであるYOLO Vision 2024 (YV24)において、Ultralytics YOLO11モデルが発表されました。YOLO11は精度とパフォーマンスを向上させつつ、YOLOv8と同じタスクをサポートしているため、過去のモデルのユーザーもシームレスに移行できます。

図1:物体検出にUltralytics YOLO11モデルを使用する例。
本記事では、物体検出とは何か、他のコンピュータビジョンのタスクとどう違うのかを解説し、その現実世界での活用事例を探ります。また、Ultralytics PythonパッケージとUltralytics HUBプラットフォームを使用してYOLO11モデルを利用する方法もステップバイステップで説明します。さあ、始めましょう!
Link to this section物体検出とは?#
物体検出は、コンピュータビジョンにおける中心的なタスクであり、単に画像内の物体を識別する以上のことを行います。特定の物体が存在するかどうかを判断するだけの画像分類とは異なり、物体検出は複数の物体を認識し、バウンディングボックスを使用してその正確な位置を特定します。
例えば、集合写真の中の顔、忙しい通りの車、あるいは店舗の棚の商品を特定し、位置を特定することができます。物体認識と位置特定を組み合わせることで、監視、群衆監視、自動在庫管理といったアプリケーションに特に役立ちます。

図2:YOLO11による顔検出。
物体検出がセマンティックセグメンテーションやインスタンスセグメンテーションのような他のタスクと一線を画しているのは、その焦点と効率性です。
セマンティックセグメンテーションは画像内のすべてのピクセルにラベルを付けますが、同じ種類の個々の物体を区別しません(例えば、写真内のすべての顔が「顔」としてグループ化されます)。インスタンスセグメンテーションはさらに一歩進んで、各物体を分離し、同じクラスの物体であっても正確な形状を輪郭で示します。
一方で物体検出は、物体を識別・分類しながらその位置をマーキングするという、より効率化されたアプローチを提供します。このため、セキュリティ映像での顔検出や自動運転車における障害物の特定といったリアルタイムのタスクに最適です。
Link to this sectionYOLO11と物体検出の活用事例#
YOLO11の高度な物体検出機能は、多くの業界で役立ちます。いくつかの例を見てみましょう。
Link to this section小売分析におけるYOLO11の活用#
YOLO11と物体検出は、在庫管理や棚の監視をより効率的かつ正確にすることで、小売分析を再定義しています。このモデルが迅速かつ確実に物体を検出する能力は、小売業者が在庫レベルを追跡し、棚を整理し、在庫カウントのミスを減らすのに役立ちます。
例えば、YOLO11は、店内の棚にあるサングラスのような特定のアイテムを検出できます。しかし、なぜ小売業者が棚を監視する必要があるのでしょうか?棚を補充して整理しておくことは、顧客が欲しいものを見つけられるようにするために不可欠であり、これが直接的に売上に影響します。棚をリアルタイムで監視することで、小売業者は商品が少なくなっている場所、場所が間違っている場所、または過密状態になっている場所を素早く見つけることができ、整理されて魅力的な陳列を維持してショッピング体験を向上させることができます。

図3:YOLO11を使用して棚の商品を検出する例。
Link to this sectionスマートシティアプリケーションにおけるYOLO11#
賑やかな都市が効率的に機能するためには、スムーズな交通の流れと安全な街路が不可欠であり、YOLO11はこれを実現する手助けをします。実際、多くのスマートシティアプリケーションがYOLO11と統合可能です。
興味深い事例の一つとして、物体検出を利用して走行中の車両のナンバープレートを識別することが挙げられます。これにより、YOLO11は、より迅速な料金徴収、より良い交通管理、およびより迅速な規制の実施をサポートできます。

図4:物体検出とYOLO11を使用してナンバープレートを検出する様子。
道路を監視するビジョンAIシステムから得られる洞察により、当局は交通違反や渋滞が大きな問題になる前に警告を受けることができます。YOLO11は歩行者や自転車も検出できるため、すべての人にとって街路がより安全で効率的になります。
実際、YOLO11が視覚データを処理する能力は、都市インフラを改善するための強力なツールとなります。例えば、車両や歩行者の動きを分析することで、信号機のタイミングを最適化するのに役立ちます。また、子供を検出してドライバーに減速を促すことで、通学路の安全性を高めることもできます。YOLO11を活用することで、都市は課題に対処するための先制的な措置を講じ、すべての人にとってより効率的な環境を作り出すことができます。
Link to this sectionYOLO11によるリアルタイムビデオ検出:アクセシビリティの向上#
リアルタイム物体検出とは、システムがライブビデオフィード内の物体が出現した瞬間にそれを識別・分類する能力を指します。YOLO11は優れたリアルタイムパフォーマンスを発揮するように設計されており、この機能のサポートに優れています。そのアプリケーションはプロセスの合理化にとどまらず、より包括的でアクセスしやすい世界を作り出す手助けにもなり得ます。
例えば、YOLO11は、リアルタイムで物体を識別することで、視覚障害のある方を支援できます。検出結果に基づいて音声による説明を提供することで、ユーザーがより自立して周囲を移動する手助けとなります。
食料品の買い物をしている視覚障害のある方を考えてみましょう。正しい商品を選ぶのは難しいことですが、YOLO11が手助けできます。商品をカートに入れる際、YOLO11と統合されたシステムを使用して、バナナ、アボカド、牛乳パックなどの各アイテムを識別し、リアルタイムで音声による説明を提供できます。これにより、ユーザーは自分の選択を確認し、必要なものがすべて揃っていることを確信できます。日常のアイテムを認識することで、YOLO11は買い物をよりシンプルにできます。

図5:物体検出は、視覚障害のある方にとって世界をより利用しやすくする手助けとなります。
Link to this sectionYOLO11による物体検出のステップバイステップガイド#
物体検出の基本とその多様な応用について説明しましたので、次はUltralytics YOLO11モデルを使用して物体検出などのタスクをどのように開始するかについて詳しく見ていきましょう。
YOLO11を利用する簡単な方法は2つあります。Ultralytics Pythonパッケージを使用する方法と、Ultralytics HUBを使用する方法です。まずはPythonパッケージを使用した両方の手法を順に見ていきましょう。
Link to this sectionYOLO11を使用した推論の実行#
推論とは、AIモデルが学習中に得た知識に基づいて、新しい未知のデータを分析し、予測を行い、情報を分類したり、洞察を提供したりすることです。物体検出の文脈では、画像やビデオ内の特定の物体を特定し、その位置を特定し、周囲にバウンディングボックスを描画し、モデルの学習に基づいてラベル付けすることを意味します。
YOLO11物体検出モデルを使用して推論を行うには、まずpip、conda、またはDockerを介してUltralytics Pythonパッケージをインストールする必要があります。インストールに関する問題が発生した場合は、トラブルシューティングガイドを確認して、解決のためのヒントやコツを得てください。インストールが完了したら、以下のコードを使用してYOLO11物体検出モデルを読み込み、画像に対して予測を行うことができます。

図6:YOLO11nを使用して画像に対して推論を実行する様子。
Link to this sectionカスタムYOLO11モデルのトレーニング#
YOLO11は、特定のユースケースに最適化するためのカスタムトレーニングもサポートしています。モデルをファインチューニングすることで、プロジェクトに関連する物体を検出するように調整できます。例えば、医療におけるコンピュータビジョンの利用において、カスタムトレーニングされたYOLO11モデルを使用して、MRIスキャンの腫瘍やX線写真の骨折など、医療画像内の特定の異常を検出し、医師がより迅速かつ正確な診断を下す支援ができます。
以下のコードスニペットは、物体検出のためにYOLO11モデルを読み込んでトレーニングする方法を示しています。YAML設定ファイルまたは事前学習済みモデルから開始し、重みを転送して、より洗練された物体検出機能のためにCOCOなどのデータセットでトレーニングを行うことができます。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.yaml") # build a new model from YAML
model = YOLO("yolo11n.pt") # load a pretrained model (recommended for training)
model = YOLO("yolo11n.yaml").load("yolo11n.pt") # build from YAML and transfer weights
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)モデルのトレーニング後、トレーニング済みのモデルをさまざまな環境にデプロイするために、さまざまな形式でエクスポートすることも可能です。
Link to this sectionUltralytics HUBにおけるYOLO11物体検出#
コードを書かない代替手段を探している方のために、Ultralytics HUBは、YOLO11を含むYOLOモデルのトレーニングとデプロイのための使いやすいビジョンAIプラットフォームを提供しています。
画像に対して物体検出を実行するには、アカウントを作成し、「Models(モデル)」セクションに移動して、YOLO11物体検出モデルのバリエーションを選択するだけです。画像をアップロードすると、プラットフォームのプレビューセクションに検出された物体が表示されます。

図7:Ultralytics HUBで推論を実行する様子。
Pythonパッケージの柔軟性とHUBの使いやすさを組み合わせることで、YOLO11は開発者や企業が高度な物体検出技術の力を活用することをシンプルにしています。
Link to this section重要なポイント#
YOLO11は物体検出の新しい基準を確立し、高い精度と汎用性を兼ね備えてさまざまな業界のニーズに応えています。小売分析の強化からスマートシティインフラの管理まで、YOLO11は数え切れないほどのアプリケーションでリアルタイムかつ信頼性の高いパフォーマンスを実現するために構築されています。
カスタムトレーニングのオプションと、Ultralytics HUBを通じた使いやすいインターフェースにより、YOLO11をワークフローに統合することがこれまでになく簡単になりました。コンピュータビジョンを探索する開発者であれ、AIで革新を目指す企業であれ、YOLO11は成功に必要なツールを提供します。
詳細については、GitHubリポジトリを確認し、コミュニティにご参加ください。自動運転車や農業向けコンピュータビジョンに関するAIの活用事例を、当社のソリューションページで探索してください。🚀






