Ultralytics YOLO11をコンピュータビジョンデータセットでカスタムトレーニングする

アビラミ・ヴィナ

4 min read

2025年1月7日

Roboflowの統合により、オープンソースのコンピュータビジョンデータセットに簡単にアクセスできるようになり、Ultralytics YOLO11のカスタムトレーニングがどのように簡素化されるかをご覧ください。

Ultralytics YOLO11のようなコンピュータビジョンモデルのトレーニングには、通常、データセットの画像を収集し、アノテーションを付け、データを準備し、特定の要件を満たすようにモデルを微調整する必要があります。Ultralytics Pythonパッケージは、これらのステップを簡単でユーザーフレンドリーにしてくれますが、ビジョンAIの開発には時間がかかります。

これは特に、締め切りが迫っていたり、プロトタイプを開発していたりする場合に当てはまります。 このような状況では、データセットの準備の合理化や反復タスクの自動化など、プロセスの一部を簡素化するツールや統合があれば、大きな違いが生まれます。必要な時間と労力を削減することで、これらのソリューションは、モデルの構築と改良に集中するのに役立ちます。Roboflowとの統合は、まさにそれを実現します。

Roboflowとの統合により、オープンソースのコンピュータビジョンデータセットの大規模なライブラリであるRoboflow Universeのデータセットに簡単にアクセスできます。データの収集と整理に何時間も費やす代わりに、既存のデータセットを素早く見つけて使用し、YOLO11のトレーニングプロセスをジャンプスタートさせることができます。この統合により、コンピュータビジョンモデル開発の実験と反復がより迅速かつシンプルになります。

この記事では、Roboflowの統合をどのように活用すれば、より迅速なモデル開発が可能になるかをご紹介します。さっそく始めましょう!

ロボフロー・ユニバースとは?

Roboflow Universeは、コンピュータビジョン開発の簡素化に注力するRoboflow社によって管理されているプラットフォームです。オブジェクト検出、画像分類、セグメンテーションなどのタスクのために、3億5000万以上の画像、50万のデータセット、10万の微調整されたモデルで構成されています。Roboflow Universeは、世界中の開発者や研究者からの貢献により、コンピュータビジョンプロジェクトを飛躍的にスタートさせたり、強化したりするための共同作業ハブとなっています。

図1.Roboflow Universe上の物体検出データセットの例。

Roboflow Universeの主な機能は以下の通りです:

  • データセット探索ツール
    ‍ データセットの探索、フィルタリング、視覚化により、プロジェクト要件に合致するリソースを素早く見つけることができます。
  • 輸出オプション:
    ‍ COCO、YOLO、TFRecord、CSVなど、ワークフローに適した形式でデータをエクスポートします。
  • データセット分析:ラベル分布、クラス不均衡、データセットの品質を可視化する分析ツールにより、さまざまなデータセットに関する洞察を得ることができます。
  • バージョン追跡:コントリビューターによってアップロードされたデータセットのさまざまなバージョンを表示し、アクセスすることで、更新を追跡し、変更を比較し、プロジェクトのニーズに最も適したバージョンを選択することができます。 

Roboflowとの統合により、適切なデータを見つけることができます。

適切なデータセットを見つけることは、コンピュータビジョンモデルを構築する上で最も困難なことの1つです。データセットの作成には通常、大量の画像を集め、それらがタスクに関連するものであることを確認し、正確にラベル付けする必要があります。 

特に短期間でさまざまなアプローチを試す場合、このプロセスには多くの時間とリソースを費やすことになる。既存のデータセットを見つけるのでさえ厄介なことがある。プラットフォームに分散していたり、適切に文書化されていなかったり、必要な特定の注釈がなかったりすることが多いからだ。

例えば、農地の雑草を検出するコンピュータ・ビジョン・アプリケーションを構築する場合、オブジェクト検出とインスタンス分割のように、異なるビジョンAIアプローチをテストしたいと思うかもしれない。これにより、独自のデータセットを収集し、ラベル付けに時間と労力を費やす前に、どの方法が最も効果的かを実験し、把握することができます。

図2.YOLO11を使った自動車部品の検出。

Roboflowとの統合により、雑草の検出、作物の健康状態、圃場のモニタリングなど、農業に関連する様々なデータセットを閲覧することができます。これらのすぐに使えるデータセットを使えば、自分でデータを作成する手間をかけることなく、さまざまなテクニックを試し、モデルを改良することができます。 

ロボフローとの統合の仕組み

さて、Roboflowインテグレーションを使って適切なデータセットを見つける方法を説明しましたが、ワークフローにどのように組み込むかを見てみましょう。Roboflow Universeからデータセットを選択したら、YOLO11フォーマットでエクスポートまたはダウンロードすることができます。データセットがエクスポートされたら、Ultralytics Pythonパッケージを使ってYOLO11をカスタムトレーニングすることができます。 

データセットのダウンロード中に、Roboflow Universeは様々なモデルをトレーニングするために他のフォーマットもサポートしていることに気づくかもしれません。では、なぜUltralytics YOLO11をカスタムトレーニングする必要があるのでしょうか? 

YOLO11はUltralytics YOLOモデルの最新バージョンで、より高速で正確な物体検出を実現するために構築されています。YOLO11では、YOLOv8mよりも22%少ないパラメータ(学習中にモデルが予測を行うために調整する内部値)を使用しながら、COCOデータセットでより高い平均精度(mAP)を達成しています。この速度と精度のバランスにより、YOLO11は幅広いコンピュータ・ビジョン・アプリケーション、特に特定のタスクに合わせてモデルをカスタム・トレーニングする場合に、汎用性の高い選択肢となります。

カスタムトレーニングYOLO11がどのように機能するのか、詳しく見てみよう:

  • データ投入:YOLO11モデルはデータセットを処理し、画像とその注釈からオブジェクトを検出・分類することを学習する。
    ‍。
  • 予測とフィードバック:モデルは画像内の物体について予測を行い、データセットに提供された正解と比較する。
  • パフォーマンスの追跡:精度(正しい検出)、リコール(見逃した検出)、ロス(予測エ ラー)などの指標を監視し、進捗を測る。
    ‍。
  • 反復学習:モデルは、検出精度を向上させ、誤差を最小化するために、複数のラウンド(エポック) をかけてパラメータを調整する。
  • 最終モデルの出力:トレーニング後、最適化されたモデルは保存され、配備の準備が整う。

コンピュータ・ビジョンの開発に焦点を当てたその他の統合

Roboflowの統合を探求していくと、Ultralyticsのドキュメントで言及されている他の統合にも気づくでしょう。Ultralyticsは、コンピュータビジョン開発の様々な段階に関連する様々な統合をサポートしています。 

これは、私たちのコミュニティにさまざまなオプションを提供するためで、特定のワークフローに最適なものを選ぶことができます。

図3.Ultralyticsがサポートする統合の概要。

データセットだけでなく、Ultralyticsがサポートするその他の統合は、トレーニング、デプロイメント、最適化など、コンピュータビジョンプロセスの様々な部分に焦点を当てています。以下は、Ultralyticsがサポートしているその他の統合の例です:

  • トレーニング統合: Amazon SageMaker や Paperspace Gradient などの統合は、効率的なモデル開発とテストのためのクラウドベースのプラットフォームを提供することで、トレーニングのワークフローを合理化します。
    ‍。
  • ワークフローと実験追跡の統合 ClearML、MLFlow、Weights & Biases (W&B) は、ワークフローの自動化、実験の追跡、コラボレーションの改善を支援し、機械学習プロジェクトの管理を容易にします。
    ‍。
  • 最適化とデプロイメントの統合: CoreML、ONNX、OpenVINOにより、様々なデバイスやフレームワークへの最適化されたデプロイメントが可能になり、AppleハードウェアやIntel CPUなどのプラットフォームで効率的なパフォーマンスを実現します。
  • モニタリングと可視化の統合: TensorBoardとWeights & Biasesは、トレーニングの進捗を可視化し、パフォーマンスを監視するツールを提供し、モデルを改良するための詳細な洞察を与えます。

YOLO11のアプリケーションと統合の役割

コンピュータ・ビジョンの開発をサポートするインテグレーションとYOLO11の信頼性の高い機能を組み合わせることで、現実世界の課題を解決することが容易になります。製造業におけるコンピュータ・ビジョンのようなイノベーションを考えてみましょう。ビジョンAIは、金属部品の傷や部品の欠落など、生産ラインの欠陥を検出するために使用されます。このようなタスクに適切なデータを収集するには、多くの場合、時間がかかり、困難で、特殊な環境にアクセスする必要があります。 

通常、生産ラインに沿ってカメラやセンサーを設置し、製品の画像を撮影する。これらの画像は、鮮明さと均一性を確保するために、多くの場合、一定の照明と角度の下で大量に撮影される必要がある。 

一度撮影した画像には、傷やへこみ、部品の欠落など、あらゆる種類の欠陥について正確なラベルを付けて、細心の注意を払わなければならない。このプロセスには、データセットが実世界のばらつきを正確に反映するように、専門知識だけでなく、かなりの時間とリソースが必要です。ロバストで信頼性の高いデータセットを作成するためには、欠陥の大きさ、形状、材質の違いなどの要因を考慮しなければなりません。

YOLO11のリアルタイム検出能力により、製造業者は生産ラインを監視し、欠陥を即座にキャッチし、効率を改善することができる。

図4.Ultralytics YOLO11を使用して製造中の缶を検出し、カウントした例。

製造業だけでなく、データセットに関連する統合は、他の多くの業界でも利用できます。YOLO11のスピードと精度を、アクセスしやすいデータセットと組み合わせることで、企業はそれぞれのニーズに合わせたソリューションを迅速に開発・展開することができます。例えば、ヘルスケア - データセットの統合は、腫瘍などの異常を検出するための医療画像を分析するソリューションの開発に役立ちます。同様に、自律走行においても、このような統合は、安全性を高めるための車両、歩行者、交通標識の識別に役立ちます。

要点

適切なデータセットを見つけることは、コンピュータビジョンモデルを構築する上で最も時間のかかることの一つです。しかし、Roboflowの統合により、コンピュータビジョンの初心者でも、Ultralytics YOLOモデルのカスタムトレーニングに最適なデータセットを簡単に見つけることができます。 

Roboflow Universeは、物体検出、画像分類、インスタンスセグメンテーションなどのコンピュータビジョンタスクのための膨大なデータセットを利用できるため、データ発見プロセスの手間を省くことができます。データの収集や整理に時間を費やすことなく、素早く開始し、モデルの構築に集中することができます。この合理的なアプローチにより、開発者はプロトタイプの作成、反復、コンピュータビジョンソリューションの開発をより効率的に行うことができます。

詳しくは、GitHub リポジトリをご覧いただき、私たちのコミュニティにご参加ください。自動運転車におけるAIや 農業におけるコンピューター・ビジョンなどの分野におけるイノベーションについては、ソリューションのページをご覧ください。🚀

AIの未来
を一緒に作りましょう!

機械学習の未来への旅を始めよう

無料で始める
クリップボードにコピーされたリンク