畳み込みニューラルネットワーク(CNN)が現代のコンピュータービジョンをどのように支えるかを探求します。層、アプリケーション、そしてリアルタイムAIのためにUltralytics YOLO26を実行する方法を学びましょう。
畳み込みニューラルネットワーク(CNN)は、格子状のトポロジーを持つデータ、特にデジタル画像を処理するために設計された特殊な深層学習アーキテクチャである。視覚野の生物学的構造に着想を得たCNNは、入力データ内の空間的関係を保持する独自の能力を持つ。 従来型ニューラルネットワークが画像を長い数値リストに平坦化するのとは異なり、CNNは画像の小さな重なり合う領域を分析し、単純なエッジやテクスチャから複雑な形状や物体に至る特徴の階層構造を自動的に学習します。この能力が、現代のコンピュータビジョン(CV)システムの基盤技術となっています。
CNNの力は、複雑な画像を、良好な予測を得るために重要な特徴を失うことなく、処理しやすい形式に削減する能力にあります。これは、入力ボリュームを出力クラスまたは値に変換する、異なる層のパイプラインを通じて実現されます。
CNNは超人的な精度で視覚的タスクを自動化し、産業を変革した。
CNNは長らく視覚タスクの標準であったが、新たに登場したアーキテクチャである ビジョン・トランスフォーマー(ViT)が台頭している。
現代のライブラリは、CNNベースのモデルを簡単に使用できるようにします。 ultralytics このパッケージは、高速推論のための高度に最適化されたCNNアーキテクチャを備えたYOLO26などの最先端モデルへのアクセスを提供します。
以下の例は、事前学習済みCNNモデルを読み込み、予測を実行する方法を示しています:
from ultralytics import YOLO
# Load a YOLO26 model, which uses an advanced CNN architecture
model = YOLO("yolo26n.pt")
# Run inference on an image to identify objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the prediction results
results[0].show()
CNNの開発は、堅牢なオープンソースツールのエコシステムによって支えられています。エンジニアは通常、カスタムアーキテクチャを構築するためにPyTorchやTensorFlowなどのフレームワークを使用します。これらのライブラリは、畳み込みとバックプロパゲーションに必要な低レベルのtensor操作を提供します。
データ収集からデプロイメントまで、コンピュータービジョンプロジェクトのライフサイクルを合理化したいチームにとって、Ultralytics Platformは包括的なソリューションを提供します。これにより複雑なワークフローが簡素化され、開発者はインフラストラクチャの管理ではなく、CNNをビジネス問題の解決に適用することに集中できます。さらに、モデルはエッジデバイスでの高性能デプロイメントのために、ONNXやTensorRTなどの形式にエクスポートできます。

未来の機械学習で、新たな一歩を踏み出しましょう。