Yolo 深圳
深セン
今すぐ参加
用語集

画像認識

画像認識によってAIがどのようにビジュアルをclassify ・理解し、ヘルスケア、小売、セキュリティなどのイノベーションを推進しているかをご覧ください。

画像認識は、より広範なコンピュータ・ビジョン(CV)の分野で重要な技術である。 コンピュータ・ビジョン(CV)の中でも重要な技術である。 画像中の物体、人、場所、文字を識別する。その核心は、この技術によってコンピュータが 人間の知覚を模倣する方法で視覚データを「見て」解釈する。デジタル画像やビデオフレームの 機械学習(ML)アルゴリズムは 機械学習(ML)アルゴリズムは 意味のあるパターンを抽出し、高レベルの概念を視覚入力に割り当てることができる。この能力は、現代の 人工知能(AI)の基礎となっている。 システムは、以前は人間の目と理解を必要としていたタスクを自動化することができる。

コア技術とメカニズム

現代の画像認識システムは、主にディープラーニング(DL)アーキテクチャに依存している。 ディープラーニング(DL)アーキテクチャに依存している。具体的には 畳み込みニューラルネットワーク(CNN) は、データの空間的関係を保持する能力により、業界標準となっている。これらのネットワークは は、何層もの数学的フィルターを通して画像を処理し 特徴抽出を行い エッジやテクスチャのような単純な形状を識別するために特徴抽出を行い、それらを組み合わせて顔や車のような複雑な実体を認識する。

これらのモデルを効果的に機能させるには、膨大な 学習データを必要とする。ラベル付けされた写真の大規模なコレクション 有名なImageNet データセットのような、ラベル付けされた写真の膨大なコレクションによって、モデルは統計的に ピクセルの特定の配列が、「ゴールデン・レトリーバー」や「信号機」といった特定のクラスに対応する確率を統計的に学習することができる。 レトリバー "や "信号機 "などである。

画像認識と関連用語の区別

他の用語と同じ意味で使われることも多いが、ニュアンスの違いを見極めることは開発者にとって重要である:

  • 画像認識と画像分類 画像分類 分類は、画像全体に単一のラベルを割り当てることを目的とする特定のサブタスクである(例:「これはビーチの写真です」)、 「これはビーチの写真です」など)。認識は、分類を含むより広い包括的な用語です。
  • 画像認識と物体検出の比較 物体検出 検出は認識をさらに一歩進めたものである。認識が画像に何が写っているかを識別するのに対して、物体検出は画像に何が写っているかを描画することによって、それがどこにあるかを識別する。 検出は特定のインスタンスを囲むバウンディング・ボックス 特定のインスタンスを囲むバウンディング・ボックスを描画する。
  • 画像認識と光学式文字認識(OCR)の比較 光学式文字認識(OCR) OCRは、テキスト文字を識別し、それをデジタル文字列に変換することに特化した認識である。 デジタル文字列に変換する。

実際のアプリケーション

画像認識の有用性は、事実上あらゆる分野に及んでいる。医療現場では 医療現場では、アルゴリズムが放射線科医を支援する。 X線やMRIの異常を自動的に認識することで放射線科医を支援し、肺炎や腫瘍のような症状の迅速な診断につなげている。 肺炎や腫瘍などの迅速な診断につながる。これは 医療画像解析

もうひとつの顕著なユースケースは、自動車産業、特に自律走行車だ。 自律走行車である。自動運転車は 自動運転車は、車線標識の認識、速度制限標識の読み取り、歩行者のdetect リアルタイムで行う識別アルゴリズムを利用して、安全上重要な判断を下している。 安全上重要な判断を下す。同様に スマート小売環境では、システムが認識を利用して 顧客が棚から商品を取り出す際に商品を識別することで、レジなしでの会計を容易にする。

YOLO11画像認識の実装

開発者は、以下のような最先端のモデルを使用して、認識機能を簡単に実装することができる。 YOLO11.YOLO 検出で有名だが、高速分類タスクもサポートしている。 高速分類タスクもサポートしている。以下の Pythonスニペットは 学習済みモデルをロードし、画像の主要な被写体を識別する。

from ultralytics import YOLO

# Load a pre-trained YOLO11 classification model
model = YOLO("yolo11n-cls.pt")

# Perform inference on an external image URL
# The model will identify the most likely class (e.g., 'sportscar')
results = model("https://ultralytics.com/images/bus.jpg")

# Display the top predicted class name
print(f"Top Prediction: {results[0].names[results[0].probs.top1]}")

今後の動向

ハードウェアの改良に伴い、この分野はエッジAIへと移行している、 この分野では、クラウドではなく、スマートフォンやカメラなどのデバイス上で直接認識が行われる。このシフト は遅延を減らし、プライバシーを向上させる。さらに モデル量子化の進歩により、これらの強力なツールは ツールはマイクロコントローラーで実行できるほど軽量化され、IoTアプリケーションの視野を広げている。 IoTアプリケーションの地平を広げている。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加