Yolo 深圳
深セン
今すぐ参加

Ultralytics YOLO ビジョン2025の主なハイライト!

Ultralytics YOLO26の発表、刺激的なパネルディスカッション、コミュニティのハイライトなど、Ultralytics今年最大のイベントを振り返ります。

9月25日、Ultralytics年次ハイブリッドビジョンAIイベントであるYOLO Vision 2025(YV25)が開催され、AIとコンピュータビジョンのコミュニティが一堂に会しました。ロンドンのThe Pelligonで開催され、世界中にストリーム配信されたこのイベントは、研究者、エンジニア、AI愛好家の多様なグループを迎え、アイデアを共有し、Ultralytics YOLO26のような新しいイノベーションについて学びました。

4年目を迎えるこのイベントは、そのリーチと影響力の点で成長を続けています。YV25ライブストリームはすでに6,800回以上の視聴回数、49,000回以上のインプレッション数、そして2,000時間近い視聴時間を獲得しています。

YV25は、主催者であるオイシン・ルニーの開会宣言で幕を開けた。彼は、参加者がつながり、共有し、このイベントを最大限に活用するよう促し、この日の基調を整えた。彼は、「YOLO Vision 2025は、データ、機械学習、コンピュータビジョンの進歩に焦点を当てるために、オープンソースのビジョンAIコミュニティを統合する会議です。

この記事では、製品発表、基調講演、パネル、ライブデモ、そしてこの日を特別なものにしたコミュニティの瞬間など、YOLO Vision 2025の主なハイライトを振り返る。さっそく始めよう!

GPU 1個から3000万ドルのシリーズA資金調達へ

イベントに先立ち、新製品の発売をめぐって多くの期待が寄せられており、創業者兼CEOであるGlenn Jocherは、その勢いをさらに高めることから一日を始めました。 

彼はUltralytics歩みを語り、2020年にはMacBookに接続した1080 Ti1台で実験を行っていたことを思い出した。このようなささやかな始まりから、Ultralytics YOLO モデルによって毎日何十億もの推論を行うグローバル・コミュニティに成長した。

グレンはまた、Ultralytics 最近3000万ドルのシリーズA資金調達を完了したことについても語った。彼は、この投資によってチームの規模を拡大し、研究を拡大し、コンピュータ・ビジョンの限界を押し広げ続けるために必要なコンピューティング・リソースを確保することができるようになり、次の成長段階への原動力となることを説明した。 

Ultralytics YOLO26:より良く、より速く、より小さなYOLO モデル

グレンは続けて、Ultralytics2つの新しい取り組みを発表した。1つ目はUltralytics YOLO26で、Ultralytics YOLO ファミリーの最新モデルであり、より小型、高速、効率的でありながら、さらに高い精度を達成できるように設計されている。2つ目は、Ultralytics Platformで、データ、トレーニング、デプロイメント、モニタリングを組み合わせた新しいエンドツーエンドのSaaSワークスペースであり、コンピュータビジョンソリューションの構築をこれまで以上に容易にするもので、近日中に発表される予定です。

図1.YOLO Vision 2025のステージでUltralytics YOLO26を発表するグレン・ジョーチャー。

YOLO26は、パフォーマンスを向上させながら、実際の使用に耐えうる実用性を維持するように構築されています。最小バージョンでも、CPU上で最大43%高速に動作しながら、精度が向上しているため、モバイルデバイスから大規模エンタープライズシステムまでのアプリケーションに最適です。YOLO26は、10月末までに一般公開される予定です。

YOLO26の主な機能をご紹介します。

  • 合理化されたアーキテクチャ: 以前はモデルの速度を低下させていたDistribution Focal Loss(DFL)モジュールが削除されました。YOLO26は、精度を犠牲にすることなく、より効率的に動作します。
  • より速い予測:YOLO26では、NMSNon-Maximum Suppression)ステップをスキップするオプションが導入され、より迅速に結果を提供できるようになり、リアルタイムでの展開が容易になりました。
  • 小さなオブジェクトの検出能力向上: 新しいトレーニング手法により、安定性が向上し、特に複雑なシーンで小さなディテールを検出する際の精度が大幅に向上します。
  • よりスマートなトレーニング: 新しいMuSGDオプティマイザーは、2つのトレーニング手法の長所を組み合わせ、モデルがより速く学習し、より高い精度に到達するのに役立ちます。

Ultralytics プラットフォームのファーストルック

YOLO26を紹介した後、グレンは製品エンジニアリングの責任者であるプラティーク・バトナガーを招き、次のプロジェクトであるUltralytics プラットフォームのデモを行った。コンピュータ・ビジョンのワークフロー全体を簡素化するために構築されたこのプラットフォームは、データセット、アノテーション、トレーニング、デプロイメント、モニタリングを1つの場所にまとめることを目的としています。

Prateek はそれを車のチューニングに例え、タイヤ、エンジン、トランスミッションのために別々の店に行く代わりに、すべてが1つのガレージで完結すると述べました。同様に、このプラットフォームは、ビジョン AI モデルのライフサイクル全体を管理するための統合されたワークスペースを開発者に提供します。

デモでは、データセットの準備を迅速化するAI支援アノテーションツール、専門家と初心者の両方に対応するカスタマイズ可能なトレーニングオプション、およびトレーニング実行のリアルタイム監視が紹介されました。 

エッジ展開に関するパネルディスカッションからの洞察

YV25のもう1つのハイライトは、Oisin Lunnyが司会を務めたエッジデプロイメントに関するパネルでした。このセッションでは、ソニーセミコンダクターソリューションズの辻雄基氏、ラズベリーパイのDavid Plowman氏、Glenn Jocher氏が講演しました。 

ディスカッションでは、AIをエッジに移行することで、レイテンシが短縮され、コストが削減され、プライバシーが向上する方法が検討されました。Yuki氏は、チップ上で直接推論を実行できるソニーのIMX500センサーを紹介しました。一方、David氏は、Raspberry Piがメーカーのルーツから大規模な商用アプリケーションに拡大していることについて語りました。

図2。Oisin Lunny、Yuki Tsuji、David Plowman、Glenn Jocherが参加したエッジ展開に関するパネルディスカッション。

パネルでは、開発者にとって最大のハードルの1つである、異なるデバイス間でモデルをスムーズに動作させることについても触れられた。ここで、Ultralytics Python パッケージが重要な役割を果たす。 

幅広いエクスポートオプションにより、訓練されたモデルをモバイル、組み込みシステム、またはエンタープライズハードウェアの本番環境に簡単に移行することができます。Ultralytics モデル変換の手間を省くことで、チームが互換性の問題に悩まされることなく、ソリューションの構築に集中できるようにします。

デビッドが説明するように、「私は苦い経験から、モデルの変換が恐ろしいことを知っています。そこで、Ultralytics 本当にストーリーを改善し、ユーザーにとって価値のあるものを提供しているのです。" 

イノベーションとAIハードウェアの加速

AIソフトウェアの進歩はハードウェアと並行して進んでおり、両者が一体となってコンピュータ・ビジョンのイノベーションの新しい波を牽引している。Ultralytics YOLO ようなモデルが精度を押し上げ続ける一方で、現実世界への影響は、それらが実行されるプラットフォームにも依存する。

例えば、Seeed Studioは、Ultralytics YOLO モデルがプリロードされたreCameraやXIAOボードのようなモジュール式の低価格ハードウェアによって、開発者がプロトタイピングから実世界のAIシステムに簡単に移行できることを紹介した。このようなハードウェアとソフトウェアの統合は、参入障壁を低くし、ハードウェアレベルでのイノベーションがいかに直接的に採用を加速させるかを示している。

ハードウェアとソフトウェアの連携設計がどのように新たな可能性を切り開いているかを強調した、他のYV25基調講演からの重要なポイントを以下に示します。

  • 量子化により大幅なスピードアップ Intel Ultralytics YOLO モデルを量子化機能付きのOpenVINO 変換することで、推論がわずか30分で54 FPSから606 FPSに向上したことを示し、最適化の威力を強調した。
  • フルスタックツールがエッジAI展開を実用化: NVIDIA 、Jetsonデバイス、TensorRT、Triton Inference Server、およびDeepStream SDKがどのように連携し、エッジでの高性能ビジョンAIの展開を効率化するかを紹介した。
    ‍。
  • オープンなエコシステムがプロトタイピングを加速: AMDは、GPUとROCmソフトウェアスタック上に構築されたエンドツーエンドのプラットフォームを強調し、開発者がコストを管理しながらプロトタイプからデプロイメントに迅速に移行できるように支援しています。
  • 低電力チップが制約のあるデバイスへのAIを拡大: DEEPXは、DX-M1およびDX-M2プロセッサを発表し、5ワット未満で数十TOPSを提供し、コンパクトで電力制限のあるシステムで高度な推論を可能にします。

コンピュータビジョンの最近のトレンド

ソフトウェアとハードウェアの両方の進歩が連携して進むことで、コンピュータビジョンはかつてないほどの速さで進化しています。これらの並行した開発は、精度と速度を向上させるだけでなく、ビジョンAIが現実世界でどのように展開できるかを形作っています。YV25では、参加者はロボティクス、エッジ展開、マルチモーダルAIの専門家から話を聞く機会があり、それぞれがこの分野の今後の方向性について異なる視点を提供していました。

例えば、D-Roboticsのマイケル・ハート氏は基調講演で、Ultralytics YOLO モデルと同社のコンパクトなRDK X5ボード(小型組み込みAIビジョンモジュール)を組み合わせることで、ロボットが高度なビジョンモデルをリアルタイムで実行できることを実演した。彼のライブ・デモは、研究室での実験から実用的なAI搭載システムへと進化したロボット工学の進歩を示していた。

図3. Michael Hartは、今日のAI対応ロボットがどのようにコンピュータビジョンに依存しているかを強調しました。

同様に、Axelera AIのAlexis CrowellSteven Hunscheは、エッジでのVision AIの展開における課題と機会を強調しました。ライブデモを通じて、Axelera AIのMetis AI Processing Units(AIPU)がRISC-Vとデジタルインメモリコンピューティングを組み合わせて、非常に低い電力で高性能を実現する方法を説明しました。M.2やPCIeなどの使い慣れたフォームファクターにパッケージ化されたこのプラットフォームのハードウェアとソフトウェアの協調設計により、エッジAIのスケーリングが実用的かつ効率的になります。

また別のセッションでは、Hugging Face Merve Noyan氏が、視覚とテキスト、音声、その他の入力を組み合わせたモデルのマルチモーダルAIの台頭について探求した。彼女は、文書分析から具現化されたエージェントまでの使用例について話し、オープンソースのイノベーションがいかにAIの採用を加速させているかを強調した。

技術の進歩と人間の価値観のバランス

YV25では刺激的な大局的な講演が行われた一方で、深く実践的なセッションも行われた。Lightning AIのJiri Borovec氏は、PyTorch LightningとマルチGPU サポートを使ってUltralytics YOLO モデルをトレーニングし、微調整する方法を実践的なウォークスルーで紹介した。 

彼はコード例を説明し、オープンソースツール、明確なドキュメント、柔軟なフレームワークによって、開発者がトレーニングを拡張し、すべての段階を検証し、ワークフローを自分のプロジェクトに適応させることがいかに容易になるかを強調しました。これは、コンピュータビジョンの真の進歩にとって、コミュニティとアクセス可能なツールがいかに重要であるかを再認識させるものでした。

スペクトルの反対側では、講演者は聴衆にAIの社会におけるより広範な役割について考えるよう促しました。基調講演で、未来学者、人道主義者、およびThe Futures AgencyのCEOであるGerd Leonhardは、「テクノロジーは、私たちがそれを使用するまで道徳的に中立である」と主張し、真の問題はAIが何ができるかだけでなく、何をすべきかであると強調しました。彼は、還元主義や虚偽などの罠に陥ることを警告し、人類の長期的な利益に真に役立つAIを求めました。

図4. Gerd Leonhard氏が、人間中心であり続けるAIソリューションの構築に関する考えを共有しています。

プライバシーとセキュリティを重視するオックスフォード大学のCarissa Véliz氏との炉辺談話でも、責任に対する焦点は継続されました。彼女は、オープンソースコミュニティがコードのチェックと改善に不可欠であり、倫理と設計は切り離せないものであると指摘しました。彼女のメッセージは明確でした。開発者は、誤用を予測し、人間の尊厳と社会の幸福を第一に考えるシステムを構築する必要があるのです。

ロンドンでのYV25ネットワーキング

YV25は、講演やデモを超えて、人々がつながる場も提供しました。コーヒーブレイクやランチの時間には、参加者が交流し、経験を共有し、アプローチを比較し、新たなコラボレーションを生み出しました。

Ultralytics チームにとっても、直接会うことができる素晴らしい機会でした。メンバーは世界中に散らばっているため、このような機会はつながりを強め、共に進歩を祝うのに役立ちます。

図5.YOLO Vision 2025での刺激的な一日を終えたUltralytics チーム。

その日はアフターパーティーで締めくくられ、参加者はリラックスしてネットワーキングを続ける機会を得ました。それは、振り返り、充電し、Vision AIの次のイノベーションの章を見据える瞬間でした。

ビジョンAIの限界を共に押し広げる

YOLO ビジョン2025は、アイデア、イノベーション、コミュニティの祭典でした。Ultralytics YOLO26の発表が舞台を整え、続いてエッジ展開と人間中心のAIに関する魅力的な講演が行われ、ビジョンAIの急速な進展と世界への影響の拡大を強調した。

基調講演に加えて、このイベントは人々を結びつけた。研究者、開発者、愛好家が経験を共有し、有意義な会話を弾ませ、未来への新たな可能性を探りました。参加者はUltralytics YOLO モデルとコンピュータービジョンの未来に興奮し、イベントは盛況のうちに幕を閉じました。

AIについてもっと知りたいですか?コミュニティGitHubリポジトリに参加して、AIとコンピュータビジョンについてさらに学びましょう。ソリューションページでは、農業におけるコンピュータビジョンロボット工学におけるAIの応用例をご覧いただけます。ライセンスオプションを確認して、今日からコンピュータビジョンを始めましょう。

AIの未来を
共に築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。

無料ではじめる