Yolo 深圳
深セン
今すぐ参加

Ultralytics YOLO11 コンピュータビジョンデータセットでカスタムトレーニングする

Abirami Vina

4分で読めます

2025年1月7日

Roboflow 統合により、オープンソースのコンピュータビジョンデータセットに簡単にアクセスできるようになり、Ultralytics YOLO11 カスタムトレーニングがどのように簡素化されるかをご覧ください。

コンピュータビジョンモデルのトレーニング Ultralytics YOLO11通常、データセットの画像を収集し、アノテーションを付け、データを準備し、特定の要件を満たすためにモデルを微調整する必要があります。Ultralytics Python パッケージは、これらのステップを簡単でユーザーフレンドリーにしてくれますが、ビジョンAIの開発には時間がかかります。

これは特に、締め切りが迫っていたり、プロトタイプを開発していたりする場合に当てはまります。 このような状況では、データセットの準備の合理化や反復タスクの自動化など、プロセスの一部を簡素化するツールや統合があれば、大きな違いが生まれます。必要な時間と労力を削減することで、これらのソリューションは、モデルの構築と改良に集中するのに役立ちます。Roboflow 統合は、まさにそれを実現します。

Roboflow 統合により、オープンソースのコンピュータビジョンデータセットの大規模なライブラリであるRoboflow Universeのデータセットに簡単にアクセスできます。データの収集と整理に何時間も費やす代わりに、既存のデータセットを素早く見つけて使用し、YOLO11 トレーニングプロセスをジャンプスタートさせることができます。この統合により、コンピュータビジョンモデル開発の実験と反復がより迅速かつシンプルになります。

この記事では、Roboflow 統合をどのように活用すれば、より迅速なモデル開発が可能になるかをご紹介します。さっそく始めましょう!

Roboflow ?

Roboflow Universeは、コンピュータビジョン開発の簡素化に注力するRoboflow社によって管理されているプラットフォームです。オブジェクト検出、画像分類、セグメンテーションなどのタスクのために、3億5000万以上の画像、50万のデータセット、10万の微調整されたモデルで構成されています。Roboflow Universeは、世界中の開発者や研究者からの貢献により、コンピュータビジョンプロジェクトを飛躍的にスタートさせたり、強化したりするための共同作業ハブとなっています。

図1.Roboflow Universe上の物体検出データセットの例。

Roboflow Universeの主な機能は以下の通りです:

  • データセット探索ツール: データセットを探索、フィルタリング、および可視化して、プロジェクトの要件に合致するリソースを迅速に見つけます。
  • 輸出オプション:
    ‍ CCOCO、YOLO、TFRecord、CSVなど、ワークフローに適した形式でデータをエクスポートします。
  • データセット分析: ラベル分布、クラスの不均衡、データセットの品質の可視化を提供する分析ツールを使用して、さまざまなデータセットに関する洞察を得ることができます。 
  • バージョン追跡:コントリビューターによってアップロードされたデータセットのさまざまなバージョンを表示し、アクセスすることで、更新をtrack し、変更を比較し、プロジェクトのニーズに最も適したバージョンを選択することができます。 

Roboflow 統合により、適切なデータを見つけることができます。

適切なデータセットを見つけることは、コンピュータビジョンモデルの構築において最も困難な部分の1つです。データセットの作成には通常、大量の画像を集め、それらがタスクに関連していることを確認し、正確にラベル付けすることが含まれます。 

特に短期間でさまざまなアプローチを試す場合、このプロセスには多くの時間とリソースが必要になることがあります。既存のデータセットを見つけることさえ難しく、プラットフォーム全体に散在していたり、適切に文書化されていなかったり、必要な特定のアノテーションが不足していたりすることがよくあります。

例えば、農地の雑草をdetect するコンピュータ・ビジョン・アプリケーションを構築する場合、オブジェクト検出とインスタンス分割のように、異なるビジョンAIアプローチをテストしたいと思うかもしれない。これにより、独自のデータセットを収集し、ラベル付けに時間と労力を費やす前に、どの方法が最も効果的かを実験し、把握することができます。

図2.YOLO11使った自動車部品の検出。

Roboflow 統合により、雑草の検出、作物の健康状態、圃場のモニタリングなど、農業に関連する様々なデータセットを閲覧することができます。これらのすぐに使えるデータセットを使えば、自分でデータを作成する手間をかけることなく、さまざまなテクニックを試し、モデルを改良することができます。 

Roboflow 統合の仕組み

さて、Roboflow インテグレーションを使って適切なデータセットを見つける方法を説明しましたが、ワークフローにどのように組み込むかを見てみましょう。Roboflow Universeからデータセットを選択したら、YOLO11 フォーマットでエクスポートまたはダウンロードすることができます。データセットがエクスポートされたら、Ultralytics Python パッケージを使ってYOLO11 カスタムトレーニングすることができます。 

データセットのダウンロード中に、Roboflow Universeは様々なモデルをトレーニングするために他のフォーマットもサポートしていることに気づくかもしれません。では、なぜUltralytics YOLO11カスタムトレーニングする必要があるのでしょうか? 

YOLO11 11はUltralytics YOLO モデルの最新バージョンで、より高速で正確な物体検出を実現するために構築されています。YOLOv8m22%少ないパラメータ(学習中にモデルが予測を行うために調整する内部値)を使用しながら、COCO データセットでより高い平均精度mAP)を達成しています。この速度と精度のバランスにより、YOLO11 幅広いコンピュータ・ビジョン・アプリケーション、特に特定のタスクに合わせてモデルをカスタム・トレーニングする場合に、汎用性の高い選択肢となります。

カスタムトレーニングYOLO11どのように機能するのか、詳しく見てみよう:

  • データ投入:YOLO11 モデルはデータセットを処理し、画像とそのアノテーションからオブジェクトをdetect ・classify することを学習する。
    ‍ 以下のように、YOLO11 モデルはデータセットを処理し、画像とそのアノテーションからオブジェクトをdetect ・classify することを学習する。
  • 予測とフィードバック: モデルは画像内のオブジェクトについて予測を行い、データセットで提供されている正解と比較します。
  • パフォーマンス追跡: 精度(正しい検出)、再現率(見逃した検出)、損失(予測誤差)などのメトリクスを監視して、進捗状況を把握します。
  • 反復学習: モデルは、検出精度を向上させ、エラーを最小限に抑えるために、複数ラウンド(エポック)にわたってパラメータを調整します。
  • 最終モデル出力: トレーニング後、最適化されたモデルが保存され、デプロイの準備が整います。

コンピュータビジョン開発に焦点を当てたその他の統合

Roboflow 統合を探求していくと、Ultralytics ドキュメントで言及されている他の統合にも気づくでしょう。Ultralyticsはコンピュータビジョン開発の様々な段階に関連する様々な統合をサポートしています。 

これは、コミュニティにさまざまなオプションを提供し、特定のワークフローに最適なものを選択できるようにするためです。

図3. Ultralyticsサポートする統合の概要。

データセットだけでなく、Ultralyticsその他の統合は、トレーニング、デプロイメント、最適化など、コンピュータビジョンプロセスの様々な部分に焦点を当てています。以下は、Ultralyticsがサポートしているその他の統合の例です:

  • トレーニング統合: Amazon SageMaker やPaperspace Gradient などの統合は、効率的なモデル開発とテストのためのクラウドベースのプラットフォームを提供することで、トレーニングのワークフローを合理化します。
    ‍。
  • ワークフローと実験追跡の統合 ClearML、MLFlow、Weights & Biases (W&B) は、ワークフローの自動化、実験のtrack 、コラボレーションの改善を支援し、機械学習プロジェクトの管理を容易にします。
    ‍。
  • 最適化とデプロイメントの統合: CoreML、ONNX、OpenVINO 、様々なデバイスやフレームワークへの最適化されたデプロイメントが可能になり、AppleハードウェアやIntel CPUなどのプラットフォームで効率的なパフォーマンスを実現します。
  • モニタリングと可視化の統合: TensorBoardとWeights & Biases 、トレーニングの進捗を可視化し、パフォーマンスを監視するツールを提供し、モデルを改良するための詳細な洞察を与えます。

YOLO11 アプリケーションと統合の役割

コンピュータ・ビジョンの開発をサポートするインテグレーションとYOLO11信頼性の高い機能を組み合わせることで、現実世界の課題を解決することが容易になります。製造業におけるコンピュータ・ビジョンのようなイノベーションを考えてみましょう。ビジョンAIは、金属部品の傷や部品の欠落など、生産ラインの欠陥をdetect ために使用されます。このようなタスクに適切なデータを収集するには、多くの場合、時間がかかり、困難で、特殊な環境にアクセスする必要があります。 

通常、製品の画像をキャプチャするために、生産ラインに沿ってカメラまたはセンサーを設置する必要があります。これらの画像は、鮮明さと均一性を確保するために、多くの場合、一貫した照明と角度で大量に撮影する必要があります。 

画像を取得したら、傷、へこみ、部品の欠落など、あらゆる種類の欠陥に対して正確なラベルを手作業で注釈する必要があります。このプロセスには、データセットが実際の変動性を正確に反映するように、多大な時間とリソース、そして専門知識が必要です。さまざまな欠陥のサイズ、形状、材料などの要素を考慮して、堅牢で信頼性の高いデータセットを作成する必要があります。

YOLO11リアルタイム検出能力により、製造業者は生産ラインをモニターし、欠陥を即座にキャッチし、効率を改善することができる。

図4.Ultralytics YOLO11 使用して製造中の缶をdetect し、カウントした例。

製造業だけでなく、データセットに関連する統合は、他の多くの業界でも利用できます。YOLO11スピードと精度を、アクセスしやすいデータセットと組み合わせることで、企業はそれぞれのニーズに合わせたソリューションを迅速に開発・展開することができます。例えば、ヘルスケア - データセットの統合は、腫瘍などの異常をdetect するための医療画像を分析するソリューションの開発に役立ちます。同様に、自律走行においても、このような統合は、安全性を高めるための車両、歩行者、交通標識の識別に役立ちます。

主なポイント

適切なデータセットを見つけることは、コンピュータビジョンモデルを構築する上で最も時間のかかることの一つです。しかし、Roboflow 統合により、コンピュータビジョンの初心者でも、Ultralytics YOLO モデルのカスタムトレーニングに最適なデータセットを簡単に見つけることができます。 

Roboflow Universeは、物体検出、画像分類、インスタンスセグメンテーションなどのコンピュータビジョンタスクのための膨大なデータセットを利用できるため、データ発見プロセスの手間を省くことができます。データの収集や整理に時間を費やすことなく、素早く開始し、モデルの構築に集中することができます。この合理的なアプローチにより、開発者はプロトタイプの作成、反復、コンピュータビジョンソリューションの開発をより効率的に行うことができます。

詳細については、GitHub リポジトリにアクセスして、コミュニティにご参加ください。ソリューションページで、自動運転車における AI農業におけるコンピュータビジョンなどの分野におけるイノベーションをご覧ください。🚀

AIの未来を
共に築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。

無料ではじめる