ヨロビジョン深圳
深セン
今すぐ参加

コンピュータビジョンデータセットを使用したUltralytics YOLO11のカスタムトレーニング

Abirami Vina

4分で読めます

2025年1月7日

Roboflowの統合が、オープンソースのコンピュータビジョンデータセットへのアクセスを容易にすることで、Ultralytics YOLOv8のカスタムトレーニングをどのように簡素化できるかを発見してください。

Ultralytics YOLO11のようなコンピュータビジョンモデルのトレーニングには通常、データセット用の画像の収集、それらへのアノテーション付け、データの準備、および特定の要件を満たすようにモデルを微調整することが含まれます。Ultralytics Pythonパッケージを使用すると、これらの手順が簡単かつユーザーフレンドリーになりますが、Vision AIの開発には依然として時間がかかる可能性があります。

これは、特に締め切りが迫っている場合や、プロトタイプを開発している場合に当てはまります。このような状況では、データセットの準備を簡素化したり、反復作業を自動化するなど、プロセスの一部を簡素化するツールや統合機能があると、大きな違いが生まれます。これらのソリューションは、時間と労力を削減することで、モデルの構築と改良に集中するのに役立ちます。Roboflowとの統合は、まさにそれを提供するものです。

Roboflowの統合により、大規模なオープンソースのコンピュータビジョンデータセットライブラリであるRoboflow Universeからデータセットに簡単にアクセスできます。データの収集と整理に何時間も費やす代わりに、既存のデータセットをすばやく見つけて使用して、YOLO11のトレーニングプロセスをすぐに開始できます。この統合により、コンピュータビジョンモデルの開発をより迅速かつ簡単に試行錯誤できます。

この記事では、Roboflowの統合を活用して、モデル開発を迅速化する方法について詳しく解説します。それでは、始めましょう。

Roboflow Universeとは?

Roboflow Universeは、コンピュータビジョンの開発を簡素化することに重点を置いている企業であるRoboflowによって維持されているプラットフォームです。3億5000万枚以上の画像、50万件のデータセット、および物体検出、画像分類、セグメンテーションなどのタスク用に微調整された10万個のモデルで構成されています。世界中の開発者や研究者からの貢献により、Roboflow Universeは、コンピュータビジョンプロジェクトをすぐに開始または強化したいと考えている人にとっての共同ハブとなっています。

図1. Roboflow Universe上の物体検出データセットの例。

Roboflow Universeには、次の主要な機能が含まれています。

  • データセット探索ツール: データセットを探索、フィルタリング、および可視化して、プロジェクトの要件に合致するリソースを迅速に見つけます。
  • エクスポートオプション: ワークフローに合わせて、COCO、YOLO、TFRecord、CSVなどの形式でデータをエクスポートできます。
  • データセット分析: ラベル分布、クラスの不均衡、データセットの品質の可視化を提供する分析ツールを使用して、さまざまなデータセットに関する洞察を得ることができます。 
  • バージョン追跡: 貢献者によってアップロードされたデータセットのさまざまなバージョンを表示およびアクセスして、更新を追跡し、変更を比較して、プロジェクトのニーズに最適なバージョンを選択できます。 

Roboflowの統合により、適切なデータを見つけることができます

適切なデータセットを見つけることは、コンピュータビジョンモデルの構築において最も困難な部分の1つです。データセットの作成には通常、大量の画像を集め、それらがタスクに関連していることを確認し、正確にラベル付けすることが含まれます。 

特に短期間でさまざまなアプローチを試す場合、このプロセスには多くの時間とリソースが必要になることがあります。既存のデータセットを見つけることさえ難しく、プラットフォーム全体に散在していたり、適切に文書化されていなかったり、必要な特定のアノテーションが不足していたりすることがよくあります。

例えば、農業分野で雑草を検出するためのコンピュータビジョンアプリケーションを構築している場合、オブジェクト検出とインスタンスセグメンテーションのような、さまざまな Vision AI アプローチをテストしたい場合があります。これにより、独自のデータセットを収集してラベル付けする時間と労力を費やす前に、どの方法が最適かを試して判断できます。

図2. YOLO11を使用した自動車部品の検出。

Roboflow統合を使用すると、雑草検出、作物の健康状態、または圃場監視に焦点を当てたものなど、農業関連のさまざまなデータセットを閲覧できます。これらのすぐに使用できるデータセットを使用すると、独自のデータを作成する手間をかけずに、さまざまな手法を試してモデルを改良できます。 

Roboflow連携の仕組み

Roboflowとの統合を使用して適切なデータセットを見つける方法を説明しましたので、それがワークフローにどのように適合するかを見ていきましょう。Roboflow Universeからデータセットを選択したら、YOLO11形式でエクスポートまたはダウンロードできます。データセットをエクスポートした後、Ultralytics Pythonパッケージを使用してYOLO11をカスタムトレーニングできます。 

データセットをダウンロードする際に、Roboflow Universeが異なるモデルをトレーニングするための他の形式もサポートしていることに気付くかもしれません。では、Ultralytics YOLO11をカスタムトレーニングする必要があるのはなぜでしょうか? 

YOLO11は、Ultralytics YOLOモデルの最新バージョンであり、より高速で正確な物体検出を実現するように構築されています。YOLOv8mよりもパラメータ(モデルが予測を行うためにトレーニング中に調整する内部値)が22%少ないにもかかわらず、COCOデータセットでより高い平均適合率(mAP)を達成しています。この速度と精度のバランスにより、YOLO11は、特に特定のタスクに合わせてカスタムトレーニングモデルを行う場合に、幅広いコンピュータビジョンアプリケーションにとって汎用性の高い選択肢となります。

YOLO11のカスタム学習の仕組みについて詳しく見ていきましょう。

  • データ供給:YOLO11モデルはデータセットを処理し、画像とそのアノテーションから物体を検出および分類する方法を学習します。
  • 予測とフィードバック: モデルは画像内のオブジェクトについて予測を行い、データセットで提供されている正解と比較します。
  • パフォーマンス追跡: 精度(正しい検出)、再現率(見逃した検出)、損失(予測誤差)などのメトリクスを監視して、進捗状況を把握します。
  • 反復学習: モデルは、検出精度を向上させ、エラーを最小限に抑えるために、複数ラウンド(エポック)にわたってパラメータを調整します。
  • 最終モデル出力: トレーニング後、最適化されたモデルが保存され、デプロイの準備が整います。

コンピュータビジョン開発に焦点を当てたその他の統合

Roboflowの統合を検討する際に、Ultralyticsのドキュメントに記載されている他の統合にも気付くでしょう。コンピュータビジョンの開発のさまざまな段階に関連するさまざまな統合をサポートしています。 

これは、コミュニティにさまざまなオプションを提供し、特定のワークフローに最適なものを選択できるようにするためです。

図3. Ultralyticsでサポートされている統合の概要

データセットに加えて、他のUltralyticsがサポートする統合は、トレーニング、デプロイメント、最適化など、コンピュータビジョンのプロセスのさまざまな部分に焦点を当てています。以下は、私たちがサポートする他の統合のいくつかの例です。

  • トレーニングの統合: Amazon SageMakerやPaperspace Gradientなどの統合により、効率的なモデル開発とテストのためのクラウドベースのプラットフォームを提供することで、トレーニングワークフローが効率化されます。
  • ワークフローと実験追跡の統合: ClearML、MLFlow、Weights & Biases(W&B)は、ワークフローの自動化、実験の追跡、コラボレーションの改善を支援し、機械学習プロジェクトの管理を容易にします。
  • 最適化とデプロイメントの統合: CoreML、ONNX、およびOpenVINOにより、さまざまなデバイスやフレームワークにわたる最適化されたデプロイメントが可能になり、AppleハードウェアやIntel CPUなどのプラットフォームで効率的なパフォーマンスが保証されます。
  • 監視と可視化の統合:TensorBoardとWeights & Biasesは、トレーニングの進捗状況を可視化し、パフォーマンスを監視するためのツールを提供し、モデルを改良するための詳細な洞察を提供します。

YOLO11 の応用事例と統合の役割

コンピュータビジョンの開発をサポートする統合は、YOLO11の信頼性の高い機能と組み合わせることで、現実世界の課題をより簡単に解決できます。製造業におけるコンピュータビジョンなどのイノベーションを検討してください。ここでは、ビジョンAIを使用して、金属部品の傷やコンポーネントの欠落など、生産ラインの欠陥を検出します。このようなタスクに適したデータを収集することは、多くの場合、時間と手間がかかり、特殊な環境へのアクセスが必要になる場合があります。 

通常、製品の画像をキャプチャするために、生産ラインに沿ってカメラまたはセンサーを設置する必要があります。これらの画像は、鮮明さと均一性を確保するために、多くの場合、一貫した照明と角度で大量に撮影する必要があります。 

画像を取得したら、傷、へこみ、部品の欠落など、あらゆる種類の欠陥に対して正確なラベルを手作業で注釈する必要があります。このプロセスには、データセットが実際の変動性を正確に反映するように、多大な時間とリソース、そして専門知識が必要です。さまざまな欠陥のサイズ、形状、材料などの要素を考慮して、堅牢で信頼性の高いデータセットを作成する必要があります。

すぐに使用できるデータセットを提供する統合により、産業品質管理などのタスクが容易になり、YOLO11のリアルタイム検出機能により、製造業者は生産ラインを監視し、欠陥を即座に検出し、効率を向上させることができます。

図4. Ultralytics YOLO11を使用して、製造中の缶を検出およびカウントする例。

製造業以外にも、データセットに関連する統合は他の多くの業界で使用できます。YOLO11の速度と精度を、簡単にアクセスできるデータセットと組み合わせることで、企業は特定のニーズに合わせて調整されたソリューションを迅速に開発および展開できます。たとえば、ヘルスケアでは、データセットの統合は、医療画像を分析して腫瘍などの異常を検出するソリューションの開発に役立ちます。同様に、自動運転では、このような統合は、車両、歩行者、交通標識を識別して安全性を高めるのに役立ちます。

主なポイント

適切なデータセットを見つけることは、コンピュータビジョンモデルの構築において最も時間のかかる部分であることがよくあります。ただし、Roboflowとの統合により、コンピュータビジョンの初心者でも、Ultralytics YOLOモデルをカスタムトレーニングするための最適なデータセットを簡単に見つけることができます。 

Roboflow Universeは、物体検出、画像分類、インスタンスセグメンテーションといったコンピュータビジョンタスクのための膨大なデータセットコレクションへのアクセスを提供し、データ探索プロセスに伴う煩雑さを解消します。これにより、データ収集や整理に時間を費やすことなく、迅速に開発を始め、モデル構築に集中できます。この効率化されたアプローチにより、開発者はコンピュータビジョンソリューションのプロトタイプ作成、反復、開発をより効率的に行うことができます。

詳細については、GitHub リポジトリにアクセスして、コミュニティにご参加ください。ソリューションページで、自動運転車における AI農業におけるコンピュータビジョンなどの分野におけるイノベーションをご覧ください。🚀

AIの未来を
共に築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。

無料ではじめる
クリップボードにコピーしました