Computer Vision (CV)
コンピュータビジョン (CV) の基礎を探索しましょう。Ultralytics YOLO26とUltralytics Platformが、オブジェクト検出、セグメンテーションなどをどのように実現するかを解説します。
Computer Vision (CV) は、人工知能 (AI) の高度な分野であり、コンピュータやシステムがデジタル画像、動画、その他の視覚入力から有意義な情報を導き出せるようにする技術です。人間の視覚は周囲を即座に認識し理解する生来の能力を持っていますが、コンピュータの場合はパターンを認識しピクセルを解釈するように訓練する必要があります。CVシステムは、機械学習 (ML) や特にディープラーニング (DL) アルゴリズムを活用することで、視覚データを処理し、その情報に基づいて推奨事項を提示したりアクションを実行したりできます。
Link to this sectionComputer Vision の仕組み#
その核心において、コンピュータは画像をピクセルを表す数値の配列として認識します。現代のCVは、人間の脳内のニューロンの接続パターンを模倣するように設計された畳み込みニューラルネットワーク (CNN) に大きく依存しています。これらのネットワークは、特徴抽出 と呼ばれるプロセスを通じて、単純なエッジやテクスチャから複雑な形状やオブジェクトに至るまで、階層的な特徴を特定するように学習します。
モデルが効果的に機能するには、膨大な量の学習データが必要です。たとえば、車を認識するためには、さまざまな条件下における何千ものラベル付けされた車の画像を処理する必要があります。Ultralytics Platform のようなツールはこのワークフローを合理化し、ユーザーがデータセットにアノテーションを付与し、クラウド上でモデルを学習させ、効率的にデプロイできるようにします。
Link to this sectionComputer Vision における主要なタスク#
Computer Vision は単一の機能ではなく、それぞれが特定の課題を解決するための異なるタスクの集合体です。
- 画像分類: このタスクは画像全体にクラスラベルを割り当て、「この画像には何が写っているか?」という問いに答えます(例:猫と犬の区別など)。
- 物体検出: さらに一歩進んで、検出タスクは画像内の個別のオブジェクトを特定し、その周囲にバウンディングボックスを描画します。これはアイテムのカウントや特定の特徴の位置特定において非常に重要です。
- インスタンスセグメンテーション: これは検出された各オブジェクトに対して正確なピクセル単位のマスクを提供し、同じクラスの個別のインスタンスを分離します。これは医療画像解析など、高い精度が求められるアプリケーションにとって不可欠です。
- ポーズ推定: これには、人体の関節など、オブジェクト上の特定のキーポイントを検出して動きや姿勢を追跡することが含まれます。
Link to this section実社会での応用#
Computer Vision の有用性は実質的にあらゆる業界に及んでおり、かつては人間の眼を必要としていたタスクを自動化しています。
- 製造および品質管理: 産業環境において、CVはマシンビジョンと呼ばれることがよくあります。これは品質検査の自動化に使用され、製造ライン上の製品の微細な欠陥を人間の検査員よりも高速かつ正確に検出します。たとえば、製造におけるAI は、装置のリアルタイム監視を可能にし、故障を未然に防ぎます。
- 自動運転: 自動運転車は安全な走行のために全面的にCVに依存しています。カメラやLiDARセンサーからの入力を処理することで、これらの車両は3D物体検出を実行し、歩行者、他の車両、交通標識をリアルタイムで特定します。これは、高度な車両自動化を実現するための重要なコンポーネントです。
- ヘルスケアおよび診断: 放射線科医はCVを使用して、X線、MRI、CTスキャンの異常を特定する際の支援を受けています。ヘルスケアにおけるAI は、肉眼では見落とされる可能性のある関心領域を強調表示することで、腫瘍の特定など早期の疾患発見に役立ちます。
Link to this sectionComputer Vision と画像処理の違い#
CVと画像処理は互いに連携することが多いものの、両者を区別することは重要です。
- 画像処理には、画像を強調したり情報を抽出したりするために操作することが含まれます(例:明るさやコントラストの調整、Adobe Photoshopのようなフィルタの適用)。その出力は通常、別の画像となります。
- Computer Visionは画像を入力として受け取り、情報や解釈を出力します(例:「この部屋には3人の人物がいる」)。CVは画像処理技術を使用して、ニューラルネットワークによる解析のために画像を準備します。
Link to this sectionPython による Computer Vision の実装#
Modern libraries have made implementing powerful CV models accessible. The example below demonstrates how to load the state-of-the-art YOLO26 model to detect objects in an image using the ultralytics package.
from ultralytics import YOLO
# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Run inference on a standard example image
# The model identifies objects and their locations
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting image with bounding boxes
results[0].show()このシンプルなスクリプトは、事前学習済みモデルを利用して複雑な推論タスクを実行し、現代のAIツールがいかに利用しやすいかを示しています。静止画像を超えて活用したい開発者向けに、CVはセキュリティやスポーツ分析で使用される動画解析やリアルタイム追跡システムも支えています。OpenCV のようなライブラリと統合することで、開発者は視覚世界をキャプチャ、処理、分析する包括的なアプリケーションを構築できます。






