YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

コンピュータビジョン(CV)

コンピュータビジョンでAIの可能性を解き放つ!オブジェクト検出、ヘルスケア、自動運転車などにおけるその役割を探求してください。今すぐ詳細をご覧ください!

コンピュータビジョン(CV)は、コンピュータが視覚世界を解釈し理解するように訓練する人工知能(AI)の分野です。カメラからのデジタル画像、ビデオ、および深層学習モデルを使用して、マシンはオブジェクトを正確に識別および分類し、次に「見る」ものに反応できます。目標は、コンピュータが人間の視覚を再現できるようにすることです。これには、膨大な量の視覚データを処理および分析して意味を理解することが含まれます。この分野は、深層学習の進歩と大規模なデータセットの利用可能性のおかげで急速に成長しました。

コンピュータビジョンの仕組み

コンピュータビジョンは、機械学習(ML)アルゴリズムを視覚データに適用することによって機能します。オブジェクトを認識するように明示的にプログラムされる代わりに、CVモデルは、数千または数百万のラベル付き画像からパターンを識別することを学習します。たとえば、猫を認識するようにモデルをトレーニングするには、猫の特徴を自分で区別できるようになるまで、無数の猫の画像が与えられます。

現代のCVは、深層学習モデル、特にConvolutional Neural Networks (CNNs)に大きく依存しています。CNNは、画像データの処理に非常に効果的なニューラルネットワークの一種です。CNNは、フィルタ(またはカーネル)を画像に適用して、エッジ、テクスチャ、形状などの重要な特徴を強調する特徴マップを作成することで機能します。これらのネットワークは、多くの一般的なコンピュータビジョンタスクを強化し、機械が視覚情報をますます正確に分析できるようにします。

コンピュータビジョン対画像処理

コンピュータビジョンと画像処理は密接に関連していますが、同じではありません。画像処理はCVのサブセットであり、デジタル画像を操作して、画像を強調したり、役立つ情報を抽出したりすることに焦点を当てています。これには、画像の鮮明化、ぼかし、またはフィルタリングなどの操作が含まれます。対照的に、コンピュータビジョンは、画像のコンテンツを解釈して理解することを目指して、さらに一歩進んでいます。たとえば、画像処理は写真の品質を向上させるために使用される場合がありますが、コンピュータビジョンは写真内の人、オブジェクト、シーンを識別するために使用されます。詳細については、デジタル画像処理の概要をご覧ください。

コンピュータビジョンにおける主要タスク

コンピュータビジョンは、機械が視覚データを分析および解釈できるようにする、いくつかの重要なタスクを包含しています。

  • 物体検出: これは、画像またはビデオ内の物体を識別し、その位置を特定するものです。Ultralytics YOLOのようなモデルは、検出された各物体の周りにバウンディングボックスを描画し、クラスラベルを割り当てます。
  • 画像分類: このタスクでは、事前定義されたカテゴリのセットから、画像全体に単一のラベルを割り当てます。たとえば、画像を「猫」または「犬」を含むものとして分類します。
  • 画像セグメンテーション: オブジェクト検出とは異なり、セグメンテーションは画像内の各ピクセルを分類します。画像の内容をより詳細に理解できます。サブタスクには、インスタンスセグメンテーションセマンティックセグメンテーションが含まれます。
  • Pose Estimation(姿勢推定): これは、空間における人またはオブジェクトの位置と向きを決定するために使用されます。ロボティクス、拡張現実、および人間の活動分析で広く使用されています。
  • 物体追跡: このタスクでは、ビデオシーケンス内で1つまたは複数の物体を時間経過とともに追跡します。これは、監視や自律航法などのアプリケーションにとって非常に重要です。

実際のアプリケーション

コンピュータビジョンの応用は、さまざまな分野でますます普及しています。

ツールとフレームワーク

コンピュータビジョンモデルの開発とデプロイは、さまざまなツールやフレームワークによって容易になっています。PyTorchPyTorchの公式サイトをご覧ください)やTensorFlowTensorFlowの公式サイトをご覧ください)のようなライブラリは、モデル構築の基礎となります。OpenCVのようなオープンソースライブラリは、リアルタイムコンピュータビジョンのための膨大な関数コレクションを提供します。

Ultralytics HUBのようなプラットフォームは、データセットの管理やカスタムモデルのトレーニングからデプロイメントまで、CVプロジェクトのライフサイクル全体を効率化します。ONNXのような標準化された形式を使用することで、異なるフレームワーク間の相互運用性を確保できます。これらの技術が成熟するにつれて、業界全体のイノベーションを推進し続けるでしょう。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました