Yolo 深圳
深セン
今すぐ参加
用語集

コンピュータビジョン(CV)

コンピュータビジョンでAIの可能性を解き放つ!オブジェクト検出、ヘルスケア、自動運転車などにおけるその役割を探求してください。今すぐ詳細をご覧ください!

コンピュータ・ビジョン(CV)は、人工知能(AI)の変革分野である。 人工知能 コンピュータが視覚の世界を知覚し、解釈し、理解することを可能にする。デジタル画像、ビデオ、その他の視覚的入力を処理することで その他の視覚入力を処理することで、機械は意味のある情報を抽出し、その分析に基づいて行動を起こしたり、推奨したりすることができる。 分析する。人間の視覚が周囲の状況を瞬時に把握するために目と脳に頼っているのに対し、コンピューター・ビジョンは は高度なソフトウェアと 機械学習(ML)アルゴリズムを採用している。 これにより、以前は人間の視覚を必要としていた作業を自動化することが可能になる。

コンピュータビジョンの仕組み

コンピュータ・ビジョンの核心は、パターン認識技術にある。 視覚データを理解するための である。初期の試みでは、オブジェクトを定義するルールを手作業でコーディングしていたが、現代のCVは、ディープラーニング(DL)と膨大な量のトレーニングによって駆動されている。 ディープラーニング(DL)と膨大な学習データ データによって駆動されている。現在最も一般的に使用されているアーキテクチャは 畳み込みニューラルネットワーク(CNN)で、画像をピクセルごとに処理する。これらのネットワークは、エッジやテクスチャのような低レベルの特徴を初期層で識別し、それらを組み合わせて複雑な画像を認識する。 初期層でエッジやテクスチャのような低レベルの特徴を識別し、それらを組み合わせてより深い層で顔や乗り物のような複雑な概念を認識する。このプロセス このプロセスでは、異なるカテゴリーを効果的に区別する方法をモデルに教えるために、大量のラベル付きデータセットが必要となる。 異なるカテゴリーを効果的に区別する方法をモデルに教えるためである。

コンピュータビジョンのコアタスク

コンピュータ・ビジョンは単一の動作ではなく、さまざまな問題を解決する特定のタスクの集合体である:

  • オブジェクトの検出このタスクは 画像やビデオストリーム内のオブジェクトを識別し、位置を特定します。検出された 検出された物体の周囲にバウンディング・ボックスを描画し "人 "や "自転車 "などのクラスラベルを割り当てます。
  • 画像の分類画像分類 システムは画像全体を分析し、その支配的な内容に基づいて単一のラベルを割り当てます。例えば 写真を "風景 "や "ポートレート "に分類する。
  • インスタンスのセグメンテーション検出よりもさらに深く 検出よりもさらに深く、各オブジェクトの正確なピクセル完璧な輪郭を識別し、同じクラスの個々のインスタンスを背景から分離する。 同じクラスの個々のインスタンスを背景から分離します。
  • 姿勢推定この技術は 人体の関節などの特定のキーポイントを検出し、動きや姿勢をリアルタイムにtrack する。

コンピュータビジョン対画像処理

コンピュータ・ビジョンとデジタル画像処理は混同されがちだが デジタル画像処理と混同されがちだが、両者の目的は異なる。画像処理は、入力画像を操作してその品質を向上させたり、情報を抽出したりすることに重点を置いている。 または情報を抽出することであり、必ずしも「理解」する必要はない。一般的な例としては、明るさの調整、フィルタの適用、ノイズ除去などがあります、 ノイズ除去などである。これとは対照的だ、 CVは画像理解に重点を置いており、人間の認知をエミュレートして画像が何を表しているかを解釈することを目標としている。

実際のアプリケーション

コンピュータ・ビジョンの有用性は、事実上あらゆる産業に及んでおり、効率性と安全性を促進している:

  • 医療診断 医療専門家はX線、MRI、CTスキャンを分析するためにCVを使用する。アルゴリズムは以下のような異常をdetect することができます。 医療画像における腫瘍 を高い精度で検出し、医師の早期診断に役立っている。
  • スマート農業農家 農家はドローン画像とCVモデルを活用して、作物の健康状態を監視し、害虫をdetect し、収穫を自動化する。以下のようなシステム リアルタイム作物モニタリング は、収穫量を最適化し、資源の浪費を減らすのに役立つ。
  • 自律走行車 自動運転車は、道路をナビゲートするためにCVに大きく依存している。複数のカメラからの入力を処理して 交通標識の検出、歩行者の追跡、車線維持などを行う。
  • 製造品質管理 組立ラインの自動検査システムは、人間の検査員よりも迅速かつ正確に製品の欠陥を特定します。 検査し、一貫した品質管理を保証します。 品質管理を実現します。

YOLO11コンピュータ・ビジョンを実装する

を使用して、強力なコンピュータビジョンタスクを実装することができます。 ultralytics Python パッケージ。以下の例は をロードする方法を示します。 YOLO11 モデル-最新版 画像内のオブジェクトをdetect するために、すべての標準的なユースケースに推奨される最新の安定バージョン。

from ultralytics import YOLO

# Load the pretrained YOLO11 model (nano version for speed)
model = YOLO("yolo11n.pt")

# Run inference on an online image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results to see bounding boxes and labels
results[0].show()

主要ツールとライブラリ

CVのエコシステムは、強固なオープンソースライブラリによって支えられている。 OpenCVは、リアルタイムコンピュータビジョンのための何千ものアルゴリズムを提供する基本的なライブラリです。 リアルタイム・コンピューター・ビジョンディープラーニングモデルの構築とトレーニングには、次のようなフレームワークがあります。 PyTorchTensorFlowのようなフレームワークが は業界標準です。Ultralytics これらの基盤の上に構築され、導入が容易な最先端のモデルを提供します。 将来的には Ultralytics プラットフォームは データ管理から展開まで、Vision AIのライフサイクル全体を管理する包括的な環境を提供します。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加