リアルタイム画像処理のためのOpenCVのコア機能を探ります。強力なコンピュータビジョンアプリケーションのために、OpenCVをUltralytics YOLO26と統合する方法を学びましょう。
OpenCV(Open Source Computer Vision Library)は、リアルタイムコンピュータービジョン (CV)および画像処理のために特別に設計された、広く利用されているオープンソースソフトウェアライブラリです。1999年にIntelによって開発されて以来、2,500以上の最適化されたアルゴリズムを提供し、研究者や開発者にとって標準的なツールへと進化しました。これらのアルゴリズムにより、コンピューターは世界からの視覚データを認識し理解し、基本的な画像操作から複雑な機械学習 (ML)推論に至るまで、さまざまなタスクを実行できます。高性能のためにC++で記述されており、OpenCVはPython、Java、MATLABなどの言語に対する堅牢なバインディングを提供し、迅速なプロトタイピングと大規模なデプロイメントに利用しやすくしています。
OpenCVはAIエコシステムにおける基盤となるレイヤーとして機能し、視覚データがディープラーニングモデルに入力される前に必要となるデータ前処理ステップをしばしば担当します。その機能はいくつかの重要な領域をカバーしています。
OpenCVは業界全体で遍在しており、しばしばディープラーニングフレームワークと連携して機能します。
OpenCVとPyTorchやTensorFlowのような深層学習フレームワークを区別することが重要です。
現代のワークフローでは、これらのツールは互いに補完し合います。例えば、開発者はOpenCVを使用してビデオストリームを読み込み、フレームのサイズを変更し、そのフレームをYOLO26モデルに渡してobject detectionを実行させ、最終的にOpenCVを再度使用して出力にバウンディングボックスを描画できます。
OpenCVは、と共に頻繁に使用されます。 ultralytics ビデオストリームを管理し、結果を可視化するためのパッケージ。この統合により、効率的なリアルタイム推論が可能になります。
以下の例は、OpenCVを使用してビデオファイルを開き、フレームを処理し、YOLO26nモデルを適用してdetectする方法を示しています。
import cv2
from ultralytics import YOLO
# Load the YOLO26 model
model = YOLO("yolo26n.pt")
# Open the video file using OpenCV
cap = cv2.VideoCapture("path/to/video.mp4")
while cap.isOpened():
success, frame = cap.read()
if not success:
break
# Run YOLO26 inference on the frame
results = model(frame)
# Visualize the results on the frame
annotated_frame = results[0].plot()
# Display the annotated frame
cv2.imshow("YOLO26 Inference", annotated_frame)
# Break loop if 'q' is pressed
if cv2.waitKey(1) & 0xFF == ord("q"):
break
cap.release()
cv2.destroyAllWindows()
OpenCVは進化を続け、新しい標準やハードウェアアクセラレーションをサポートしています。その広大なコミュニティは、チュートリアルとドキュメントの豊富なエコシステムに貢献しています。コンピュータービジョンプロジェクトをローカルプロトタイプからクラウドベースのソリューションへとスケールアップしようとしているチームにとって、Ultralytics Platformは、OpenCVベースの前処理パイプラインとシームレスに統合するデータセット管理およびモデルトレーニングのための包括的なツールを提供します。顔認識セキュリティシステムであれ、スポーツ分析における姿勢推定であれ、OpenCVはAI開発者のツールキットにおいて不可欠なユーティリティであり続けています。
未来の機械学習で、新たな一歩を踏み出しましょう。