ヨロビジョン深圳
深セン
今すぐ参加

UltralyticsのYOLO Vision 2025からの主要なハイライト!

Abirami Vina

5分で読めます

2025年9月29日

Ultralyticsの今年最大のイベントのまとめとして、Ultralytics YOLO26の発表、刺激的なパネルディスカッション、主要なコミュニティのハイライトをご紹介します。

AIとコンピュータビジョンのコミュニティは、9月25日にUltralyticsの年次ハイブリッドVision AIイベントであるYOLO Vision 2025(YV25)のために集まりました。ロンドンのThe Pelligonで開催され、世界中にストリーミング配信されたこのイベントでは、研究者、エンジニア、AI愛好家など多様なグループを迎え、Ultralytics YOLO26などの新しいイノベーションについてアイデアを共有し、学びました。

4年目を迎えるこのイベントは、そのリーチと影響力の点で成長を続けています。YV25ライブストリームはすでに6,800回以上の視聴回数、49,000回以上のインプレッション数、そして2,000時間近い視聴時間を獲得しています。

YV25は、ホストであるOisin Lunny氏のオープニングノートで幕を開けました。彼は、参加者同士が繋がり、共有し、イベントを最大限に活用することを奨励し、その日の雰囲気を設定しました。彼が述べたように、「YOLO Vision 2025は、オープンソースのビジョンAIコミュニティを結集し、データ、機械学習、コンピュータビジョンの進歩に焦点を当てる会議です。」

この記事では、YOLO Vision 2025の主要なハイライトを振り返ります。製品発表、基調講演、パネルディスカッション、ライブデモ、そしてその日を特別なものにしたコミュニティの瞬間などについてご紹介します。それでは、始めましょう!

単一のGPUから3000万ドルのシリーズA資金調達へ

イベントに先立ち、新製品の発売をめぐって多くの期待が寄せられており、創業者兼CEOであるGlenn Jocherは、その勢いをさらに高めることから一日を始めました。 

彼はUltralyticsの道のりを語り、2020年にはMacBookに接続された1枚の1080 Tiで実験を行っていたことを振り返りました。今日では時代遅れとなったセットアップです。そのようなささやかな始まりから、UltralyticsはYOLOモデルによって毎日数十億の推論を可能にするグローバルコミュニティに成長しました。

Glennはまた、Ultralyticsが最近3,000万ドルのシリーズA資金調達ラウンドを完了したことについても話しました。彼は、この投資が、チームの規模拡大、研究の拡大、およびコンピュータビジョンの限界を押し広げ続けるために必要なコンピューティングリソースの確保を可能にすることで、次の成長段階をどのように推進するかを説明しました。 

Ultralytics YOLO26:より良く、より速く、より小型なYOLOモデル

GlennはUltralyticsからの2つの新たな取り組みを発表しました。1つ目は、Ultralytics YOLOファミリーの最新モデルであるUltralytics YOLO26です。これは、より小さく、より速く、より効率的でありながら、さらに高い精度を達成するように設計されています。2つ目は、Ultralytics Platformです。これは、データ、トレーニング、デプロイメント、モニタリングを組み合わせ、これまで以上に簡単にコンピュータビジョンソリューションを構築できるようにする、新しいエンドツーエンドのSaaSワークスペースであり、近い将来発表される予定です。

図1. グレン・ジョカーがYOLO Vision 2025のステージでUltralytics YOLO26を発表。

YOLO26は、パフォーマンスを向上させながら、実際の使用に耐えうる実用性を維持するように構築されています。最小バージョンでも、CPU上で最大43%高速に動作しながら、精度が向上しているため、モバイルデバイスから大規模エンタープライズシステムまでのアプリケーションに最適です。YOLO26は、10月末までに一般公開される予定です。

YOLO26の主な機能をご紹介します。

  • 合理化されたアーキテクチャ: 以前はモデルの速度を低下させていたDistribution Focal Loss(DFL)モジュールが削除されました。YOLO26は、精度を犠牲にすることなく、より効率的に動作します。
  • より高速な予測: YOLO26では、Non-Maximum Suppression(NMS)ステップをスキップするオプションが導入され、より迅速に結果を提供し、リアルタイムでのデプロイを容易にします。
  • 小さなオブジェクトの検出能力向上: 新しいトレーニング手法により、安定性が向上し、特に複雑なシーンで小さなディテールを検出する際の精度が大幅に向上します。
  • よりスマートなトレーニング: 新しいMuSGDオプティマイザーは、2つのトレーニング手法の長所を組み合わせ、モデルがより速く学習し、より高い精度に到達するのに役立ちます。

Ultralyticsプラットフォームの概要

YOLO26を紹介した後、Glennは当社の製品エンジニアリング責任者であるPrateek Bhatnagarを招き、次のプロジェクトであるUltralytics Platformのデモを行いました。コンピュータビジョンのワークフロー全体を簡素化するために構築されたこのプラットフォームは、データセット、アノテーション、トレーニング、デプロイメント、およびモニタリングを1か所にまとめることを目指しています。

Prateek はそれを車のチューニングに例え、タイヤ、エンジン、トランスミッションのために別々の店に行く代わりに、すべてが1つのガレージで完結すると述べました。同様に、このプラットフォームは、ビジョン AI モデルのライフサイクル全体を管理するための統合されたワークスペースを開発者に提供します。

デモでは、データセットの準備を迅速化するAI支援アノテーションツール、専門家と初心者の両方に対応するカスタマイズ可能なトレーニングオプション、およびトレーニング実行のリアルタイム監視が紹介されました。 

エッジ展開に関するパネルディスカッションからの洞察

YV25のもう1つのハイライトは、Oisin Lunnyが司会を務めたエッジデプロイメントに関するパネルでした。このセッションでは、ソニーセミコンダクターソリューションズの辻雄基氏、ラズベリーパイのDavid Plowman氏、Glenn Jocher氏が講演しました。 

ディスカッションでは、AIをエッジに移行することで、レイテンシが短縮され、コストが削減され、プライバシーが向上する方法が検討されました。Yuki氏は、チップ上で直接推論を実行できるソニーのIMX500センサーを紹介しました。一方、David氏は、Raspberry Piがメーカーのルーツから大規模な商用アプリケーションに拡大していることについて語りました。

図2。Oisin Lunny、Yuki Tsuji、David Plowman、Glenn Jocherが参加したエッジ展開に関するパネルディスカッション。

また、パネルディスカッションでは、開発者にとって最大のハードルの1つである、異なるデバイス間でモデルをスムーズに実行させることについても触れられました。ここで、Ultralytics Pythonパッケージが重要な役割を果たします。 

幅広いエクスポートオプションにより、トレーニング済みのモデルをモバイル、組み込みシステム、またはエンタープライズハードウェアに簡単に移行できます。Ultralyticsは、モデル変換の苦労を取り除くことで、チームが互換性の問題に取り組むのではなく、ソリューションの構築に集中できるように支援します。

Davidが説明したように、「モデルの変換はひどいものであり、他の誰かがそれをやってくれるなら、はるかに楽になるという苦い経験から私は知っています。Ultralyticsはまさにストーリーを改善し、ユーザーにとって価値のあるものを提供しているのです。」 

イノベーションとAIハードウェアの加速

AIソフトウェアの進歩はハードウェアと並行して進んでおり、両者が一体となってコンピュータビジョンの新たなイノベーションの波を推進しています。Ultralytics YOLOのようなモデルは精度を向上させ続けていますが、その現実世界での影響は、それらが実行されるプラットフォームにも左右されます。

例えば、Seeed Studioは、Ultralytics YOLOモデルがプリロードされたreCameraやXIAOボードのようなモジュール式の低コストハードウェアが、開発者がプロトタイピングから現実世界のAIシステムに移行するのをいかに容易にするかを紹介しました。この種のハードウェアとソフトウェアの統合により、参入障壁が下がり、ハードウェアレベルでのイノベーションが採用を直接加速する方法を示しています。

ハードウェアとソフトウェアの連携設計がどのように新たな可能性を切り開いているかを強調した、他のYV25基調講演からの重要なポイントを以下に示します。

  • 量子化により大幅な速度向上が可能:Intelは、Ultralytics YOLOモデルを量子化によってOpenVINOに変換することで、わずか30分で推論が54 FPSから606 FPSに向上することを示し、最適化の威力を強調しました。
  • フルスタックツールにより、エッジAIのデプロイが実用的になります: NVIDIAは、Jetsonデバイス、TensorRT、Triton Inference Server、およびDeepStream SDKが連携して、エッジでの高性能ビジョンAIのデプロイを効率化する方法を強調しました。
  • オープンなエコシステムがプロトタイピングを加速: AMDは、GPUとROCmソフトウェアスタック上に構築されたエンドツーエンドのプラットフォームを強調し、開発者がコストを管理しながらプロトタイプからデプロイメントに迅速に移行できるように支援しています。
  • 低電力チップが制約のあるデバイスへのAIを拡大: DEEPXは、DX-M1およびDX-M2プロセッサを発表し、5ワット未満で数十TOPSを提供し、コンパクトで電力制限のあるシステムで高度な推論を可能にします。

コンピュータビジョンの最近のトレンド

ソフトウェアとハードウェアの両方の進歩が連携して進むことで、コンピュータビジョンはかつてないほどの速さで進化しています。これらの並行した開発は、精度と速度を向上させるだけでなく、ビジョンAIが現実世界でどのように展開できるかを形作っています。YV25では、参加者はロボティクス、エッジ展開、マルチモーダルAIの専門家から話を聞く機会があり、それぞれがこの分野の今後の方向性について異なる視点を提供していました。

例えば、彼の基調講演で、D-RoboticsのMichael Hart氏は、Ultralytics YOLOモデルと彼らのコンパクトなRDK X5ボード(小型の組み込みAIビジョンモジュール)を組み合わせることで、ロボットが高度なビジョンモデルをリアルタイムで実行できるようになることを実証しました。彼のライブデモは、ロボット工学が実験室での実験から実用的なAI搭載システムへと、いかに進化したかを示しました。

図3. Michael Hartは、今日のAI対応ロボットがどのようにコンピュータビジョンに依存しているかを強調しました。

同様に、Axelera AIのAlexis CrowellSteven Hunscheは、エッジでのVision AIの展開における課題と機会を強調しました。ライブデモを通じて、Axelera AIのMetis AI Processing Units(AIPU)がRISC-Vとデジタルインメモリコンピューティングを組み合わせて、非常に低い電力で高性能を実現する方法を説明しました。M.2やPCIeなどの使い慣れたフォームファクターにパッケージ化されたこのプラットフォームのハードウェアとソフトウェアの協調設計により、エッジAIのスケーリングが実用的かつ効率的になります。

また別のセッションでは、Hugging FaceのMerve Noyan氏が、ビジョンとテキスト、オーディオ、その他の入力を組み合わせたマルチモーダルAIの台頭について解説しました。彼女は、ドキュメント分析からエンボディドエージェントまで、幅広いユースケースについて語り、オープンソースのイノベーションがAIの導入を加速させていることを強調しました。

技術の進歩と人間の価値観のバランス

YV25は刺激的な全体像に関する講演を特集しましたが、非常に実践的なセッションも含まれていました。Lightning AIのJiri Borovecは、PyTorch LightningとマルチGPUサポートを使用してUltralytics YOLOモデルをトレーニングおよびファインチューニングする方法を示す実践的なウォークスルーを行いました。 

彼はコード例を説明し、オープンソースツール、明確なドキュメント、柔軟なフレームワークによって、開発者がトレーニングを拡張し、すべての段階を検証し、ワークフローを自分のプロジェクトに適応させることがいかに容易になるかを強調しました。これは、コンピュータビジョンの真の進歩にとって、コミュニティとアクセス可能なツールがいかに重要であるかを再認識させるものでした。

スペクトルの反対側では、講演者は聴衆にAIの社会におけるより広範な役割について考えるよう促しました。基調講演で、未来学者、人道主義者、およびThe Futures AgencyのCEOであるGerd Leonhardは、「テクノロジーは、私たちがそれを使用するまで道徳的に中立である」と主張し、真の問題はAIが何ができるかだけでなく、何をすべきかであると強調しました。彼は、還元主義や虚偽などの罠に陥ることを警告し、人類の長期的な利益に真に役立つAIを求めました。

図4. Gerd Leonhard氏が、人間中心であり続けるAIソリューションの構築に関する考えを共有しています。

プライバシーとセキュリティを重視するオックスフォード大学のCarissa Véliz氏との炉辺談話でも、責任に対する焦点は継続されました。彼女は、オープンソースコミュニティがコードのチェックと改善に不可欠であり、倫理と設計は切り離せないものであると指摘しました。彼女のメッセージは明確でした。開発者は、誤用を予測し、人間の尊厳と社会の幸福を第一に考えるシステムを構築する必要があるのです。

ロンドンでのYV25ネットワーキング

YV25は、講演やデモを超えて、人々がつながる場も提供しました。コーヒーブレイクやランチの時間には、参加者が交流し、経験を共有し、アプローチを比較し、新たなコラボレーションを生み出しました。

Ultralyticsチームにとっても、直接会って交流できる素晴らしい機会となりました。メンバーが世界中に散らばっているため、このような時間はつながりを強化し、共に進捗を祝うのに役立ちます。

図5. Ultralyticsチームは、YOLO Vision 2025で刺激的な一日を終えました。

その日はアフターパーティーで締めくくられ、参加者はリラックスしてネットワーキングを続ける機会を得ました。それは、振り返り、充電し、Vision AIの次のイノベーションの章を見据える瞬間でした。

ビジョンAIの限界を共に押し広げる

YOLO Vision 2025は、アイデア、イノベーション、そしてコミュニティを祝うイベントでした。Ultralytics YOLOv26の発表が幕を開け、その後、エッジ展開や人間中心のAIに関する魅力的な講演が行われ、Vision AIの急速な進歩と、世界への影響力の拡大が強調されました。

基調講演に加えて、このイベントは人々を結びつけました。研究者、開発者、愛好家が経験を共有し、有意義な会話を spark し、将来の新しい可能性を探求しました。イベントは、参加者がUltralytics YOLOモデルとコンピュータビジョンの将来に興奮して、最高の形で終了しました。

AIについてもっと知りたいですか?コミュニティGitHubリポジトリに参加して、AIとコンピュータビジョンについてさらに学びましょう。ソリューションページでは、農業におけるコンピュータビジョンロボット工学におけるAIの応用例をご覧いただけます。ライセンスオプションを確認して、今日からコンピュータビジョンを始めましょう。

AIの未来を
共に築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。

無料ではじめる