コンピュータビジョンでAIの可能性を解き放つ!オブジェクト検出、ヘルスケア、自動運転車などにおけるその役割を探求してください。今すぐ詳細をご覧ください!
コンピュータ・ビジョン(CV)は、人工知能(AI)の変革分野である。 人工知能 コンピュータが視覚の世界を知覚し、解釈し、理解することを可能にする。デジタル画像、ビデオ、その他の視覚的入力を処理することで その他の視覚入力を処理することで、機械は意味のある情報を抽出し、その分析に基づいて行動を起こしたり、推奨したりすることができる。 分析する。人間の視覚が周囲の状況を瞬時に把握するために目と脳に頼っているのに対し、コンピューター・ビジョンは は高度なソフトウェアと 機械学習(ML)アルゴリズムを採用している。 これにより、以前は人間の視覚を必要としていた作業を自動化することが可能になる。
コンピュータ・ビジョンの核心は、パターン認識技術にある。 視覚データを理解するための である。初期の試みでは、オブジェクトを定義するルールを手作業でコーディングしていたが、現代のCVは、ディープラーニング(DL)と膨大な量のトレーニングによって駆動されている。 ディープラーニング(DL)と膨大な学習データ データによって駆動されている。現在最も一般的に使用されているアーキテクチャは 畳み込みニューラルネットワーク(CNN)で、画像をピクセルごとに処理する。これらのネットワークは、エッジやテクスチャのような低レベルの特徴を初期層で識別し、それらを組み合わせて複雑な画像を認識する。 初期層でエッジやテクスチャのような低レベルの特徴を識別し、それらを組み合わせてより深い層で顔や乗り物のような複雑な概念を認識する。このプロセス このプロセスでは、異なるカテゴリーを効果的に区別する方法をモデルに教えるために、大量のラベル付きデータセットが必要となる。 異なるカテゴリーを効果的に区別する方法をモデルに教えるためである。
コンピュータ・ビジョンは単一の動作ではなく、さまざまな問題を解決する特定のタスクの集合体である:
コンピュータ・ビジョンとデジタル画像処理は混同されがちだが デジタル画像処理と混同されがちだが、両者の目的は異なる。画像処理は、入力画像を操作してその品質を向上させたり、情報を抽出したりすることに重点を置いている。 または情報を抽出することであり、必ずしも「理解」する必要はない。一般的な例としては、明るさの調整、フィルタの適用、ノイズ除去などがあります、 ノイズ除去などである。これとは対照的だ、 CVは画像理解に重点を置いており、人間の認知をエミュレートして画像が何を表しているかを解釈することを目標としている。
コンピュータ・ビジョンの有用性は、事実上あらゆる産業に及んでおり、効率性と安全性を促進している:
を使用して、強力なコンピュータビジョンタスクを実装することができます。 ultralytics Python パッケージ。以下の例は
をロードする方法を示します。 YOLO11 モデル-最新版
画像内のオブジェクトをdetect するために、すべての標準的なユースケースに推奨される最新の安定バージョン。
from ultralytics import YOLO
# Load the pretrained YOLO11 model (nano version for speed)
model = YOLO("yolo11n.pt")
# Run inference on an online image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results to see bounding boxes and labels
results[0].show()
CVのエコシステムは、強固なオープンソースライブラリによって支えられている。 OpenCVは、リアルタイムコンピュータビジョンのための何千ものアルゴリズムを提供する基本的なライブラリです。 リアルタイム・コンピューター・ビジョンディープラーニングモデルの構築とトレーニングには、次のようなフレームワークがあります。 PyTorchや TensorFlowのようなフレームワークが は業界標準です。Ultralytics これらの基盤の上に構築され、導入が容易な最先端のモデルを提供します。 将来的には Ultralytics プラットフォームは データ管理から展開まで、Vision AIのライフサイクル全体を管理する包括的な環境を提供します。


