YOLO26の紹介: 次世代のビジョンAI。
Ultralytics
ガイド

2025年のコンピュータビジョンについて知っておくべきすべてのこと

コンピュータビジョンが、物体検出、画像分類、姿勢推定といったAI駆動のタスクによってどのように業界を変革しているかをご覧ください。

ABAbirami Vina
5 min read
業界全体におけるコンピュータビジョンの応用

20年前、機械やコンピュータが世界を見て理解できるという考えは、単なるSF小説の話でした。今日、人工知能(AI)の進歩のおかげで、その概念は現実のものとなっています。特にAIの一分野であるコンピュータビジョン(CV)は、機械が画像や動画を理解し分析することを可能にします。リアルタイムでの物体識別、セキュリティシステムの向上、複雑なタスクの自動化など、その可能性は可能性の限界を押し広げています。

コンピュータビジョンは、さまざまな業界がその独自の能力を活用する多様な方法を模索する中で、テクノロジーの未来を急速に形作っています。世界におけるコンピュータビジョンの市場規模は2024年に198億3000万ドルに達し、今後数年間で毎年19.8%の成長が見込まれています。

世界のコンピュータビジョン市場規模のチャート

図1。コンピュータビジョンの世界市場規模。

本記事では、コンピュータビジョンについて詳しく見ていきます。それが何であり、どのように進化し、今日どのように機能しているかを取り上げます。また、最も興味深い応用例のいくつかについても探ります。それでは始めましょう!

Link to this sectionコンピュータビジョンとは何か?#

コンピュータビジョンは、機械学習とニューラルネットワークを活用して、画像や動画ファイルなどの視覚データのコンテンツを理解するようにコンピュータに教えるAIのサブフィールドです。処理された画像から収集されたインサイトは、より良い意思決定に使用できます。例えば、コンピュータビジョンは小売業において、棚の画像を分析して在庫レベルを追跡したり、自動チェックアウトシステムでショッピング体験を向上させたりするために使用できます。多くの企業がすでに、スマートフォンの写真へのフィルター追加といったタスクから、製造業における品質管理まで、さまざまな用途にコンピュータビジョン技術を利用しています。

なぜコンピュータビジョンソリューションの必要性がこれほどまでにあるのか、疑問に思うかもしれません。欠陥を見つけたりパターンを認識したりするといった、常に注意を払う必要があるタスクは、人間にとっては難しい場合があります。特に動きが速い環境や複雑な環境では、目が疲れたり詳細を見落としたりすることがあります。

人間はさまざまなサイズ、色、照明、角度の物体を認識することには長けていますが、プレッシャーの下で一貫性を保つことには苦労することがよくあります。一方で、コンピュータビジョンソリューションは休むことなく、大量の視覚データを迅速かつ正確に処理します。例えば、リアルタイムで交通状況を分析して渋滞を検知し、信号のタイミングを最適化したり、人間の観察者よりも速く事故を特定したりすることができます。

Link to this sectionコンピュータビジョンの歴史を理解する#

長年にわたり、コンピュータビジョンは理論的な概念から、業界全体のイノベーションを促進する信頼できる技術へと進化してきました。その発展を定義づけてきた重要なマイルストーンをいくつか見てみましょう。

  • 1950年代〜1960年代: 研究者は視覚データを処理および分析するためのアルゴリズムの開発を開始しましたが、計算能力の制限により進歩は遅いものでした。

  • 1970年代: この10年間で、ハフ変換などのアルゴリズムに大きな改善が見られ、画像内の線や幾何学的形状の検出が向上しました。光学的文字認識(OCR)も登場し、機械が印刷されたテキストを読み取ることが可能になりました。

  • 1980年代〜1990年代: 機械学習がコンピュータビジョンで役割を果たし始め、より高度な機能と将来のブレークスルーへの道が開かれました。

  • 2000年代〜2010年代: ディープラーニングがコンピュータビジョンに新たな次元をもたらし、機械が視覚データをより効果的に解釈できるようになりました。これにより、物体識別、動作解析、複雑なタスク実行などの機能が強化されました。

Nowadays, computer vision is advancing quickly and transforming how we solve problems in areas like healthcare, autonomous vehicles, and smart cities. Ultralytics YOLO (You Only Look Once) models, designed for real-time computer vision tasks, make it easier to implement vision AI effectively and accurately across various industries. As AI and hardware continue to improve, these models are helping businesses make smarter decisions and streamline operations by using advanced visual data analysis.

Link to this sectionコンピュータビジョンの仕組みを解説#

コンピュータビジョンシステムは、人間の脳の働きを模したアルゴリズムであるニューラルネットワークを使用して画像を分析します。畳み込みニューラルネットワーク(CNN)と呼ばれる特定のタイプは、写真内のエッジや形状といったパターンを認識するのに特に優れています。

視覚データを単純化するために、プーリングのような技術は画像の中で最も重要な部分に焦点を当て、追加のレイヤーがこの情報を処理して、特徴の識別や物体の検出といったタスクを実行します。スピードと正確性のために設計されたUltralytics YOLO11のような高度なモデルは、リアルタイムの画像処理を可能にします。

物体検出にUltralytics YOLO11を使用

図2。Ultralytics YOLO11を使用した物体検出の例。

典型的なコンピュータビジョンアプリケーションには、生の画像を有用なインサイトに変えるためのいくつかのステップが含まれます。主な4つの段階は以下の通りです。

  • 画像取得: カメラやセンサーを使用して視覚データが収集されます。画像の品質は使用されるセンサーのタイプに依存します。

  • 画像処理: 収集されたデータは、ノイズの低減やエッジの強調といった前処理技術を通じて強化され、分析が容易になります。

  • 特徴抽出: 形状やテクスチャといった重要な詳細が抽出され、画像の中で最も重要な部分に焦点を合わせます。

  • パターン認識: 識別された特徴は機械学習を使用して分析され、物体の検出、動作の追跡、パターン認識といったタスクを完了します。

Link to this sectionコンピュータビジョンのタスクを探る#

コンピュータビジョンがどのように機能するかを説明する際、コンピュータビジョンのタスクについて触れたことに気づかれたかもしれません。Ultralytics YOLO11のようなモデルは、これらのタスクをサポートするように構築されており、現実世界のアプリケーションに高速で正確なソリューションを提供します。物体の検出からその動きの追跡まで、YOLO11はこれらのタスクを効率的に処理します。それがサポートする主要なコンピュータビジョンタスクのいくつかを見ていきましょう。

Link to this sectionオブジェクト検出#

物体検出は重要なコンピュータビジョンタスクであり、画像内の関心のある物体を特定するために使用されます。物体検出タスクの出力は、バウンディングボックス(画像内で検出された物体の周りに描かれた矩形)、クラスラベル(「車」や「人」といった各物体のカテゴリまたは種類)、および信頼度スコア(各検出についてモデルがどの程度確信しているかを示す数値)のセットです。例えば、物体検出を使用して、路上にいる歩行者や交通中の車を特定し、その場所を突き止めることができます。

画像内の物体を検出するYOLO11

図3。物体を検出するために使用されているYOLO11。

Link to this section画像分類#

画像分類の主な目的は、入力画像に対してその全体的な内容に基づいて定義済みのラベルまたはカテゴリを割り当てることです。このタスクには通常、画像内の主要な物体や特徴を識別することが含まれます。例えば、画像分類を使用して、画像に猫が含まれているか犬が含まれているかを判断できます。YOLO11のようなコンピュータビジョンモデルは、以下に示すように、個々の猫や犬の品種を分類するようにカスタムトレーニングすることも可能です。

YOLO11を使用して異なる猫の品種を分類

図4。YOLO11を使用して異なる猫の品種を分類。

Link to this sectionインスタンスセグメンテーション#

インスタンスセグメンテーションは、さまざまなアプリケーションで使用されるもう一つの重要なコンピュータビジョンタスクです。これには画像をセグメントに分解し、同じタイプの複数の物体が存在する場合でも、各個々の物体を特定することが含まれます。物体検出とは異なり、インスタンスセグメンテーションは各物体の境界を正確に輪郭を描くことで一歩踏み込んでいます。例えば、自動車の製造や修理において、インスタンスセグメンテーションは各車の部品を個別に識別してラベル付けするのに役立ち、プロセスをより正確かつ効率的にします。

YOLO11を使用して自動車部品をセグメンテーション

図5。 YOLO11を使用した車の部品のセグメンテーション。

Link to this section姿勢推定#

姿勢推定の目標は、手、頭、肘といったキーポイントの位置を予測することで、人や物体の位置と向きを決定することです。これは、リアルタイムで物理的な動作を理解することが重要なアプリケーションで特に役立ちます。人間の姿勢推定は、スポーツ分析、動物の行動モニタリング、ロボティクスなどの分野で一般的に使用されています。

YOLO11を使用して人体のポーズ推定

図6。 YOLO11は人間の姿勢推定を支援できます。

YOLO11がサポートする他のコンピュータビジョンタスクを探るには、公式Ultralyticsドキュメントを参照してください。YOLO11が物体追跡や指向性バウンディングボックス(OBB)物体検出といったタスクをどのように処理するかについての詳細情報が提供されています。

Link to this section今日の人気のあるコンピュータビジョンモデル#

多くのコンピュータビジョンモデルが存在するにもかかわらず、Ultralytics YOLOシリーズはその強力なパフォーマンスと汎用性で際立っています。時間が経つにつれて、Ultralytics YOLOモデルは改良され、より高速で、より正確になり、より多くのタスクを処理できるようになりました。Ultralytics YOLOv5が導入されたとき、PyTorchのようなVision AIフレームワークを使用してモデルをデプロイすることが容易になりました。これにより、より幅広いユーザーが高度なVision AIを扱えるようになり、高い精度と使いやすさが両立されました。

次に、Ultralytics YOLOv8は、インスタンスセグメンテーション、姿勢推定、画像分類といった新しい機能を追加することで、さらに前進しました。一方、最新バージョンのYOLO11は、複数のコンピュータビジョンタスク全体で最高のパフォーマンスを発揮します。YOLOv8mよりもパラメータ数が22%少ないYOLO11mは、COCOデータセットにおいてより高い平均精度(mAP)を達成しており、これは物体をより正確かつ効率的に検出できることを意味します。経験豊富な開発者であろうとAI初心者であろうと、YOLO11はあなたのコンピュータビジョンのニーズに対する強力なソリューションを提供します。

Link to this section日常生活におけるコンピュータビジョンの役割#

前述の通り、YOLO11のようなコンピュータビジョンモデルは、幅広い業界で適用できます。今度は、私たちの日常生活を変えつつある他のユースケースを探ってみましょう。

Link to this sectionヘルスケアにおけるVision AI#

ヘルスケアにおけるコンピュータビジョンには、幅広い応用があります。物体検出や分類といったタスクは、医療画像において病気の検出をより迅速かつ正確にするために使用されます。X線分析において、コンピュータビジョンは人間の目にはあまりにも微妙すぎるパターンを特定できます。

また、がん細胞と健康な細胞を比較するためのがん検出にも使用されています。同様に、CTスキャンやMRIに関しても、コンピュータビジョンは人間と同等レベルの精度で画像を分析するために使用できます。これは医師がより良い意思決定を行うことを助け、最終的にはより多くの命を救うことにつながります。

医療スキャンを分析するYOLO11

図7。医療スキャンを分析するために使用されているYOLO11。

Link to this section自動車業界におけるAI#

コンピュータビジョンは自動運転車にとって不可欠であり、道路標識や信号機といった物体を検出するのに役立ちます。光学的文字認識(OCR)などの技術により、車は道路標識からテキストを読み取ることができます。また、物体検出タスクがリアルタイムで人を特定する歩行者検出にも使用されています。

さらに、コンピュータビジョンは路面のひび割れやポットホール(穴)を発見することもでき、変化する道路状況の監視を向上させます。全体として、コンピュータビジョン技術は交通管理の改善、交通安全の強化、スマートシティ計画の支援において重要な役割を果たすことができます。

YOLO11を使用して交通状況を理解

図8。 YOLO11を使用して交通状況を理解する。

Link to this section農業におけるコンピュータビジョン#

農家が心配することなく、作物の種まき、水やり、収穫を自動的に時間通りに行えるとしましょう。コンピュータビジョンは農業にまさにそれをもたらします。リアルタイムの作物モニタリングを促進し、農家が病気や栄養不足などの問題を人間よりも正確に検出できるようにします。

モニタリングに加えて、コンピュータビジョンと統合されたAI駆動の自動除草機は、雑草を識別して除去することができ、人件費を削減し、収穫量を向上させます。この技術の組み合わせは、農家がリソースを最適化し、効率を改善し、作物を保護するのに役立ちます。

農業にYOLO11を使用

図9。農業でYOLO11を使用する例。

Link to this sectionAIによる製造プロセスの自動化#

製造において、コンピュータビジョンは生産の監視、製品品質のチェック、作業者の追跡を自動的に行うのに役立ちます。Vision AIはプロセスをより迅速かつ正確にし、同時にエラーを減らすことでコスト削減につながります。

具体的には、品質保証のために、物体検出とインスタンスセグメンテーションが一般的に使用されています。欠陥検出システムは最終製品の最終チェックを行い、最高の製品だけが顧客に届くようにします。へこみやひび割れのある製品は自動的に識別されて拒否されます。これらのシステムはまた、製品をリアルタイムで追跡およびカウントし、組立ラインの継続的な監視を提供します。

コンピュータビジョンを使用して組立ラインを監視

図10。 コンピュータビジョンを使用して組立ラインを監視する。

Link to this sectionコンピュータビジョンでよりインパクトのある教育を実現#

教室でコンピュータビジョンが使用される方法の一つは、ジェスチャー認識です。これは学生の動きを検出することで学習をパーソナライズします。YOLO11のようなモデルはこのタスクに最適です。挙手や混乱した表情といったジェスチャーをリアルタイムで正確に識別できます。

そのようなジェスチャーが検出されると、継続中のレッスンは、追加のヘルプを提供したり、学生のニーズに合わせてコンテンツを修正したりすることで調整できます。これにより、よりダイナミックで適応性の高い学習環境が生まれ、教師が指導に集中する一方で、システムが各学生の学習体験をサポートします。

Link to this sectionコンピュータビジョンの最近の傾向#

さまざまな業界におけるコンピュータビジョンの応用例をいくつか探ったので、その進歩を促進している主なトレンドを詳しく見ていきましょう。

主要なトレンドの一つは、データをソースの近くで処理する分散コンピューティングフレームワークであるエッジコンピューティングです。例えば、エッジコンピューティングはカメラやセンサーのようなデバイスが直接視覚データを処理できるように装備し、応答時間の高速化、遅延の低減、プライバシーの向上をもたらします。

コンピュータビジョンのもう一つの主要なトレンドは、マージドリアリティ(融合現実)の使用です。これはコンピュータビジョンを使用して仮想オブジェクトを現実世界とスムーズにブレンドし、物理世界とデジタル要素を組み合わせます。ゲーミング、教育、トレーニングでの体験を向上させるために使用できます。

Link to this sectionコンピュータビジョンの長所と短所#

コンピュータビジョンがさまざまな業界にもたらす主要なメリットをいくつか挙げます。

  • コスト削減: コンピュータビジョンでタスクを自動化することは、運用コストの削減、生産性の向上、エラーの最小化に役立ちます。

  • スケーラビリティ: 一度実装されると、コンピュータビジョンシステムは大量のデータを処理するために容易に拡張でき、成長している企業や大規模な運用に適しています。

  • アプリケーション固有のカスタマイズ: コンピュータビジョンモデルは、あなたのデータセットを使用して微調整(ファインチューニング)でき、アプリケーションの要件を満たす高度に専門化されたソリューションを提供します。

これらのメリットは、コンピュータビジョンがさまざまな業界にどのような影響を与えるかを強調していますが、実装に伴う課題を考慮することも重要です。主要な課題をいくつか挙げます。

  • データプライバシーの懸念: 監視やヘルスケアのような機密分野での視覚データの使用は、プライバシーの問題やセキュリティ上の懸念を引き起こす可能性があります。

  • 環境的な制限: コンピュータビジョンシステムは、不十分な照明、低品質の画像、複雑な背景など、困難な環境では正常に機能することに苦労する場合があります。

  • 高い初期コスト: コンピュータビジョンシステムを開発および実装することは、専門的なハードウェア、ソフトウェア、および専門知識が必要となるため、高額になる可能性があります。

Link to this section重要なポイント#

コンピュータビジョンは、人間と同じように世界を見て理解させることで、機械が世界と対話する方法を再発明しています。これは、自動運転車の安全向上、医師による病気の早期診断、ショッピングのパーソナライズ化、さらには農家による作物モニタリングの支援など、多くの分野ですでに使用されています。

テクノロジーが改善し続ける中、エッジコンピューティングやマージドリアリティのような新しいトレンドがさらに多くの可能性を切り開いています。バイアスや高コストといったいくつかの課題はありますが、コンピュータビジョンは将来、多くの業界に大きなプラスの影響を与える可能性を秘めています。

詳細については、GitHubリポジトリを訪問し、コミュニティに参加してください。AI in self-driving carscomputer vision in agricultureといったセクターでのイノベーションを、ソリューションページで探索してください。🚀

Explore solutions

Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら

AIの未来を共に築き上げましょう!

機械学習の未来とともに旅を始めましょう