YOLOビジョン2025にご期待ください!
2025年9月25日
10:00 - 18:00
ハイブリッド・イベント
ヨロ・ビジョン2024

ウルトラリティクスのYOLOビジョン2025の主なハイライト!

アビラミ・ヴィナ

5分で読める

2025年9月29日

Ultralytics YOLO26の発表、刺激的なパネルディスカッション、コミュニティのハイライトなど、Ultralyticsの今年最大のイベントを振り返ります。

9月25日、Ultralyticsの年次ハイブリッドビジョンAIイベントであるYOLO Vision 2025(YV25)が開催され、AIとコンピュータビジョンのコミュニティが一堂に会しました。ロンドンのThe Pelligonで開催され、世界中にストリーム配信されたこのイベントは、研究者、エンジニア、AI愛好家の多様なグループを迎え、アイデアを共有し、Ultralytics YOLO26のような新しいイノベーションについて学びました。

今年で4年目を迎えるこのイベントは、リーチとインパクトの面で成長を続けている。YV25のライブストリームは、すでに6,800以上の視聴を獲得し、49,000以上のインプレッションを生み出し、約2,000時間の視聴時間を集めた。

YV25は、主催者であるオイシン・ルニーの開会宣言で幕を開けた。彼は、参加者がつながり、共有し、このイベントを最大限に活用するよう促し、この日の基調を整えた。彼は、「YOLO Vision 2025は、データ、機械学習、コンピュータビジョンの進歩に焦点を当てるために、オープンソースのビジョンAIコミュニティを統合する会議です。

この記事では、製品発表、基調講演、パネル、ライブデモ、そしてこの日を特別なものにしたコミュニティの瞬間など、YOLO Vision 2025の主なハイライトを振り返る。さっそく始めよう!

GPU1個から3000万ドルのシリーズA資金調達へ

イベントに先立ち、新製品発表の興奮が高まっていたが、創業者兼CEOのグレン・ジョーチャーは、そのエネルギーを高めることからこの日をスタートさせた。 

彼はUltralyticsの歩みを語り、2020年にはMacBookに接続した1080 Ti1台で実験を行っていたことを思い出した。このようなささやかな始まりから、UltralyticsはYOLOモデルによって毎日何十億もの推論を行うグローバル・コミュニティに成長した。

グレンはまた、ウルトラリティクスが最近3000万ドルのシリーズA資金調達を完了したことについても語った。彼は、この投資によってチームの規模を拡大し、研究を拡大し、コンピュータ・ビジョンの限界を押し広げ続けるために必要なコンピューティング・リソースを確保することができるようになり、次の成長段階への原動力となることを説明した。 

Ultralytics YOLO26:より良く、より速く、より小さなYOLOモデル

グレンは続けて、ウルトラリティクスの2つの新しい取り組みを発表した。1つ目はUltralytics YOLO26で、Ultralytics YOLOファミリーの最新モデルであり、より小型、高速、効率的でありながら、さらに高い精度を達成できるように設計されている。2つ目は、Ultralytics Platformで、データ、トレーニング、デプロイメント、モニタリングを組み合わせた新しいエンドツーエンドのSaaSワークスペースであり、コンピュータビジョンソリューションの構築をこれまで以上に容易にします。

図1.YOLO Vision 2025のステージでUltralytics YOLO26を発表するグレン・ジョーチャー。

YOLO26は、実世界での使用に耐えうる実用的な性能を維持しながら、性能を押し上げるように作られている。最小バージョンは、精度を向上させながら、すでにCPU上で最大43%高速に動作しており、モバイル機器から大規模な企業システムまでのアプリケーションに理想的なものとなっている。YOLO26は10月末までに一般公開される予定だ。

YOLO26の主な特徴を紹介しよう:

  • アーキテクチャの合理化:分布焦点損失(DFL)モジュールが削除されました。YOLO26は、精度を犠牲にすることなく、より効率的に動作するようになった。
  • より速い予測:YOLO26では、NMS(Non-Maximum Suppression)ステップをスキップするオプションが導入され、より迅速に結果を提供できるようになり、リアルタイムでの展開が容易になりました。
  • 小さな物体の検出がより得意に:新しいトレーニング方法により安定性が向上し、特に複雑なシーンの小さなディテールを検出する際の精度が大幅に向上。
  • よりスマートなトレーニング:新しいMuSGDオプティマイザーは、2つのトレーニング手法の長所を組み合わせることで、モデルの学習を高速化し、より高い精度を達成します。

Ultralyticsプラットフォームのファーストルック

YOLO26を紹介した後、グレンは製品エンジニアリングの責任者であるプラティーク・バトナガーを招き、次のプロジェクトであるUltralyticsプラットフォームのデモを行った。コンピュータ・ビジョンのワークフロー全体を簡素化するために構築されたこのプラットフォームは、データセット、アノテーション、トレーニング、デプロイメント、モニタリングを1つの場所にまとめることを目的としています。

プラティークはこれを車のチューニングに例えた。タイヤ、エンジン、トランスミッションのためにさまざまなショップを訪れる代わりに、すべてが1つのガレージで行われる。同じように、このプラットフォームは、ビジョンAIモデルのライフサイクル全体を管理するための統合されたワークスペースを開発者に提供する。

デモでは、データセットの準備をスピードアップするAI支援アノテーションツール、熟練者にも初心者にもカスタマイズ可能なトレーニングオプション、トレーニング実行のリアルタイムモニタリングが紹介された。 

エッジ展開に関するパネルディスカッションからの洞察

YV25のもうひとつのハイライトは、オイシン・ルニーがモデレーターを務めたエッジデプロイメントに関するパネルだった。このセッションには、ソニーセミコンダクターソリューションズの辻勇輝氏、ラズベリーパイのデビッド・プラウマン氏、グレン・ジョーチャー氏が参加した。 

ディスカッションでは、AIのエッジへの移行がいかにレイテンシーを削減し、コストを下げ、プライバシーを向上させるかを探った。結城は、チップ上で直接推論を実行できるソニーのIMX500センサーを紹介した。一方、デビッドは、ラズベリー・パイがそのメーカーとしてのルーツから大規模な商用アプリケーションへとどのように拡大しているかについて話した。

図2.オイシン・ルニー、辻勇輝、デイヴィッド・プラウマン、グレン・ジョーチャーによるエッジ展開に関するパネル。

パネルでは、開発者にとって最大のハードルの1つである、異なるデバイス間でモデルをスムーズに動作させることについても触れられた。ここで、Ultralytics Pythonパッケージが重要な役割を果たす。 

幅広いエクスポートオプションにより、訓練されたモデルをモバイル、組み込みシステム、またはエンタープライズハードウェアの本番環境に簡単に移行することができます。Ultralyticsはモデル変換の手間を省くことで、チームが互換性の問題に悩まされることなく、ソリューションの構築に集中できるようにします。

デビッドが説明するように、「私は苦い経験から、モデルの変換が恐ろしいことを知っています。そこで、Ultralyticsは本当にストーリーを改善し、ユーザーにとって価値のあるものを提供しているのです。" 

イノベーションとAIハードウェアの加速

AIソフトウェアの進歩はハードウェアと並行して進んでおり、両者が一体となってコンピュータ・ビジョンのイノベーションの新しい波を牽引している。Ultralytics YOLOのようなモデルが精度を押し上げ続ける一方で、現実世界への影響は、それらが実行されるプラットフォームにも依存する。

例えば、Seeed Studioは、UltralyticsのYOLOモデルがプリロードされたreCameraやXIAOボードのようなモジュール式の低価格ハードウェアによって、開発者がプロトタイピングから実世界のAIシステムに簡単に移行できることを紹介した。このようなハードウェアとソフトウェアの統合は、参入障壁を低くし、ハードウェアレベルでのイノベーションがいかに直接的に採用を加速させるかを示している。

YV25の他の基調講演から、ハードウェアとソフトウェアの共同設計がいかに新たな可能性を引き出しているかを強調した主な内容をいくつか紹介しよう:

  • 量子化により大幅なスピードアップインテルは、UltralyticsのYOLOモデルを量子化機能付きのOpenVINOに変換することで、推論がわずか30分で54 FPSから606 FPSに向上したことを示し、最適化の威力を強調した。
  • フルスタックツールがエッジAIの展開を実用化: NVIDIAは、Jetsonデバイス、TensorRT、Triton Inference Server、DeepStream SDKがどのように連携し、エッジでの高性能ビジョンAIの展開を効率化するかを紹介した。
    ‍。
  • オープン・エコシステムがプロトタイピングを加速:AMDは、GPUとROCmソフトウェア・スタック上に構築されたエンド・ツー・エンド・プラットフォームを強調し、開発者がコストを抑制しながらプロトタイプから展開まで迅速に移行できるよう支援した。
  • 低消費電力チップは、制約のあるデバイスにAIを拡大する:DEEPXはDX-M1とDX-M2プロセッサを発表した。5ワット以下で数十TOPSを実現し、コンパクトで電力制限のあるシステムで高度な推論を可能にする。

コンピュータ・ビジョンの最新動向

ソフトウェアとハードウェアの進歩が相まって、コンピュータービジョンはかつてない速さで進化している。このような並行的な発展は、単に精度と速度を向上させるだけでなく、ビジョンAIが実世界でどのように展開できるかを形成している。YV25では、ロボット工学、エッジデプロイメント、マルチモーダルAIの各分野の専門家から話を聞く機会があり、それぞれがこの分野の方向性について異なる見解を示した。

例えば、D-Roboticsのマイケル・ハート氏は基調講演で、UltralyticsのYOLOモデルと同社のコンパクトなRDK X5ボード(小型の組み込みAIビジョン・モジュール)を組み合わせることで、ロボットが高度なビジョン・モデルをリアルタイムで実行できることを実演した。彼のライブ・デモは、研究室での実験から実用的なAI搭載システムへと進化したロボット工学の進歩を示していた。

図3.マイケル・ハートは、今日のAI対応ロボットがいかにコンピュータ・ビジョンに依存しているかを強調した。

同様に、Axelera AIのAlexis Crowell氏とSteven Hunsche氏は、エッジにおけるビジョンAIの展開の課題と可能性を強調した。彼らはライブデモを通じて、アクセラAIのMetis AI Processing Units(AIPUs)がRISC-Vとデジタルインメモリコンピューティングを組み合わせることで、非常に低い消費電力で高いパフォーマンスを実現する方法を説明した。M.2やPCIeのような使い慣れたフォームファクターにパッケージされたこのプラットフォームのハードウェア・ソフトウェア協調設計により、エッジAIのスケーリングが実用的かつ効率的になります。

また別のセッションでは、Hugging FaceのMerve Noyan氏が、視覚とテキスト、音声、その他の入力を組み合わせたモデルのマルチモーダルAIの台頭について探求した。彼女は、文書分析から具現化されたエージェントまでの使用例について話し、オープンソースのイノベーションがいかにAIの採用を加速させているかを強調した。

技術的進歩と人間的価値のバランス

YV25では刺激的な大局的な講演が行われた一方で、深く実践的なセッションも行われた。Lightning AIのJiri Borovec氏は、PyTorch LightningとマルチGPUサポートを使ってUltralytics YOLOモデルをトレーニングし、微調整する方法を実践的なウォークスルーで紹介した。 

彼はコード例を示しながら、オープンソースのツール、明確なドキュメント、柔軟なフレームワークが、開発者がトレーニングの規模を拡大したり、すべての段階を検証したり、自分のプロジェクトにワークフローを適応させたりすることをいかに容易にしているかを強調した。コンピュータビジョンの真の進歩のために、コミュニティとアクセス可能なツールがいかに重要であるかを再認識させられた。

一方、講演者たちは、社会におけるAIの幅広い役割について考えるよう聴衆に促した。未来学者でヒューマニスト、フューチャーズ・エージェンシーのCEOであるゲルト・レオンハルト氏は基調講演で、「テクノロジーは、それを使うまでは道徳的に中立である」と主張し、真の問題はAIに何ができるかではなく、何をすべきかであると強調した。彼は、還元主義や真実性の欠如といった罠に陥ることを警告し、人類の長期的利益に真に役立つAIを求めた。

図4.人間中心でありながらAIソリューションを構築するための考えを共有するゲルト・レオンハルト。

オックスフォード大学のカリッサ・ヴェリズ氏は、プライバシーとセキュリティを強調した。彼女は、オープンソースのコミュニティはコードのチェックと改善に不可欠であり、倫理とデザインは切っても切れない関係にあると指摘した。彼女のメッセージは明確だった。開発者は悪用を予測し、人間の尊厳と社会的福利を第一に考えたシステムを構築する必要がある。

YV25でロンドンでネットワーキング

講演やデモにとどまらず、YV25は人々が交流する場も設けた。コーヒーブレイクやランチの間、参加者たちは交流し、経験を共有し、アプローチを比較し、新たなコラボレーションを生み出した。

ウルトラリティクスのチームにとっても、直接会うことができる素晴らしい機会でした。メンバーは世界中に散らばっているため、このような機会はつながりを強め、共に進歩を祝うのに役立ちます。

図5.YOLO Vision 2025での刺激的な一日を終えたUltralyticsチーム。

一日の締めくくりはアフターパーティーで、参加者はリラックスしながらネットワーキングを続けた。振り返り、充電し、ビジョンAIのイノベーションの次の章を展望するひとときとなった。

ビジョンAIの限界に挑む

YOLOビジョン2025は、アイデア、イノベーション、コミュニティの祭典でした。Ultralytics YOLO26の発表が舞台を整え、続いてエッジ展開と人間中心のAIに関する魅力的な講演が行われ、ビジョンAIの急速な進展と世界への影響の拡大を強調した。

基調講演に加えて、このイベントは人々を結びつけた。研究者、開発者、愛好家が経験を共有し、有意義な会話を弾ませ、未来への新たな可能性を探りました。参加者はUltralyticsのYOLOモデルとコンピュータービジョンの未来に興奮し、イベントは盛況のうちに幕を閉じました。

AIを探求する準備はできていますか?私たちのコミュニティと GitHubリポジトリに参加して、AIとコンピュータビジョンについてもっと学びましょう。農業と ロボット工学における コンピュータビジョンのアプリケーションをもっと調べるには、ソリューションページをご覧ください。ライセンスオプションをチェックして、今すぐコンピュータビジョンを始めましょう!

AIの未来
を一緒に作りましょう!

機械学習の未来への旅を始めよう

無料で始める
クリップボードにコピーされたリンク