Explore how Convolutional Neural Networks (CNNs) power modern computer vision. Learn about layers, applications, and how to run Ultralytics YOLO26 for real-time AI.
畳み込みニューラルネットワーク(CNN)は、格子状のトポロジーを持つデータ、特にデジタル画像を処理するために設計された特殊な深層学習アーキテクチャである。視覚野の生物学的構造に着想を得たCNNは、入力データ内の空間的関係を保持する独自の能力を持つ。 従来型ニューラルネットワークが画像を長い数値リストに平坦化するのとは異なり、CNNは画像の小さな重なり合う領域を分析し、単純なエッジやテクスチャから複雑な形状や物体に至る特徴の階層構造を自動的に学習します。この能力が、現代のコンピュータビジョン(CV)システムの基盤技術となっています。
CNNの真価は、複雑な画像を処理しやすい形式に還元しつつ、良好な予測を得るために不可欠な特徴を損なわない点にある。これは、入力ボリュームを出力クラスまたは値へ変換する一連の異なる層からなるパイプラインによって達成される:
CNNは超人的な精度で視覚的タスクを自動化し、産業を変革した。
CNNは長らく視覚タスクの標準であったが、新たに登場したアーキテクチャである ビジョン・トランスフォーマー(ViT)が台頭している。
現代のライブラリは、CNNベースのモデルを簡単に使用できるようにします。 ultralytics このパッケージは、高速推論のための高度に最適化されたCNNアーキテクチャを備えたYOLO26などの最先端モデルへのアクセスを提供します。
以下の例は、事前学習済みCNNモデルを読み込み、予測を実行する方法を示しています:
from ultralytics import YOLO
# Load a YOLO26 model, which uses an advanced CNN architecture
model = YOLO("yolo26n.pt")
# Run inference on an image to identify objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the prediction results
results[0].show()
CNNの開発は、オープンソースツールの堅牢なエコシステムによって支えられています。エンジニアは通常、PyTorchやTensorFlowなどのフレームワークを使用します。 PyTorch や TensorFlow などのフレームワークを使用してカスタムアーキテクチャを構築します。これらのライブラリは畳み込みや バックプロパゲーションに必要な低次元のtensor を提供します。
コンピュータビジョンプロジェクトのライフサイクル(データ収集からデプロイまで)を効率化したいチーム向けに、Ultralytics 包括的なソリューションを提供します。複雑なワークフローを簡素化し、開発者がインフラ管理ではなくCNNを適用してビジネス課題を解決することに集中できるようにします。さらに、モデルはONNXなどの形式にエクスポート可能です。 ONNX や TensorRT などの形式でエクスポートでき、エッジデバイス上での高性能なデプロイが可能です。