Ultralyticsの進むべき道
リアルタイムビジョンAIを数百万人に届けたモデルから、今後リリース予定のものまで。これまでに提供したものと、次に控えているものをご紹介します。
数百万人にリアルタイム物体検出をもたらしたリリース — PyTorchネイティブであり、高速かつ驚くほど簡単にトレーニング可能です。
検出、セグメンテーション、分類、姿勢推定、回転バウンディングボックスを一つのフレームワークで実現します。
YOLO Vision 2024で発表された、より少ないパラメータで高い精度を実現する洗練されたアーキテクチャです。
現在推奨しているモデル — すべてのビジョンタスクにおいて、より高速かつ高精度で、本番環境での利用に対応しています。
データの注釈付け、YOLOモデルのトレーニング、そして世界43リージョンへのデプロイまでを一つの場所で完結させるエンドツーエンドのプラットフォームです。
初のセマンティックセグメンテーションモデル — シーン全体を理解するための詳細なピクセル単位のクラスラベルを提供します。
より高速で高精度なマルチオブジェクトトラッキング — 現実世界のビデオにおいて、遮蔽や混雑したシーンでも安定したID維持を実現します。
- Re-ID(再識別) — カメラ間や遮蔽の後でもオブジェクトの同一性を一貫して保持します
組み込みの蒸留機能により、大きな教師モデルを精度を維持したまま、より小さく高速な生徒モデルに圧縮します — エッジやリアルタイムデプロイに最適です。
製造業の品質保証向けに専用設計された異常検知 — 製造ライン上で欠陥や規格外の部品を即座に捕捉します。
中国・深セン · YOLO Vision 2026
YOLO Vision 2026でライブ発表された、3D認識へファミリーを拡大するYOLOの次世代フラッグシップ:
- YOLO-Depth — 単一カメラからの単眼深度推定
- YOLO-StereoDepth — ロボティクス向けの双眼視差深度、LiDARに代わるカメラネイティブな代替手段
LLM主導の反復的なトレーニング分析。各実行を自動診断し、連続するラウンドを通じて構成を微調整することで精度を向上させます。
2027年を通じてYOLOファミリーに新しい機能が追加されます:
- YOLO-OCR — 高速かつ正確なテキスト認識
- YOLO-Face — 顔認識および解析
- YOLO-VLM — 効率的なビジョン・言語パイプラインのために、より深いLLM層へ入力する軽量なYOLOフロントエンド