Ultralyticsの今年最大のイベントのまとめとして、Ultralytics YOLO26の発表、刺激的なパネルディスカッション、主要なコミュニティのハイライトをご紹介します。
Ultralyticsの今年最大のイベントのまとめとして、Ultralytics YOLO26の発表、刺激的なパネルディスカッション、主要なコミュニティのハイライトをご紹介します。
AIとコンピュータビジョンのコミュニティは、9月25日にUltralyticsの年次ハイブリッドVision AIイベントであるYOLO Vision 2025(YV25)のために集まりました。ロンドンのThe Pelligonで開催され、世界中にストリーミング配信されたこのイベントでは、研究者、エンジニア、AI愛好家など多様なグループを迎え、Ultralytics YOLO26などの新しいイノベーションについてアイデアを共有し、学びました。
4年目を迎えるこのイベントは、そのリーチと影響力の点で成長を続けています。YV25ライブストリームはすでに6,800回以上の視聴回数、49,000回以上のインプレッション数、そして2,000時間近い視聴時間を獲得しています。
YV25は、ホストであるOisin Lunny氏のオープニングノートで幕を開けました。彼は、参加者同士が繋がり、共有し、イベントを最大限に活用することを奨励し、その日の雰囲気を設定しました。彼が述べたように、「YOLO Vision 2025は、オープンソースのビジョンAIコミュニティを結集し、データ、機械学習、コンピュータビジョンの進歩に焦点を当てる会議です。」
この記事では、YOLO Vision 2025の主要なハイライトを振り返ります。製品発表、基調講演、パネルディスカッション、ライブデモ、そしてその日を特別なものにしたコミュニティの瞬間などについてご紹介します。それでは、始めましょう!
イベントに先立ち、新製品の発売をめぐって多くの期待が寄せられており、創業者兼CEOであるGlenn Jocherは、その勢いをさらに高めることから一日を始めました。
彼はUltralyticsの道のりを語り、2020年にはMacBookに接続された1枚の1080 Tiで実験を行っていたことを振り返りました。今日では時代遅れとなったセットアップです。そのようなささやかな始まりから、UltralyticsはYOLOモデルによって毎日数十億の推論を可能にするグローバルコミュニティに成長しました。
Glennはまた、Ultralyticsが最近3,000万ドルのシリーズA資金調達ラウンドを完了したことについても話しました。彼は、この投資が、チームの規模拡大、研究の拡大、およびコンピュータビジョンの限界を押し広げ続けるために必要なコンピューティングリソースの確保を可能にすることで、次の成長段階をどのように推進するかを説明しました。
GlennはUltralyticsからの2つの新たな取り組みを発表しました。1つ目は、Ultralytics YOLOファミリーの最新モデルであるUltralytics YOLO26です。これは、より小さく、より速く、より効率的でありながら、さらに高い精度を達成するように設計されています。2つ目は、Ultralytics Platformです。これは、データ、トレーニング、デプロイメント、モニタリングを組み合わせ、これまで以上に簡単にコンピュータビジョンソリューションを構築できるようにする、新しいエンドツーエンドのSaaSワークスペースであり、近い将来発表される予定です。

YOLO26は、パフォーマンスを向上させながら、実際の使用に耐えうる実用性を維持するように構築されています。最小バージョンでも、CPU上で最大43%高速に動作しながら、精度が向上しているため、モバイルデバイスから大規模エンタープライズシステムまでのアプリケーションに最適です。YOLO26は、10月末までに一般公開される予定です。
YOLO26の主な機能をご紹介します。
YOLO26を紹介した後、Glennは当社の製品エンジニアリング責任者であるPrateek Bhatnagarを招き、次のプロジェクトであるUltralytics Platformのデモを行いました。コンピュータビジョンのワークフロー全体を簡素化するために構築されたこのプラットフォームは、データセット、アノテーション、トレーニング、デプロイメント、およびモニタリングを1か所にまとめることを目指しています。
Prateek はそれを車のチューニングに例え、タイヤ、エンジン、トランスミッションのために別々の店に行く代わりに、すべてが1つのガレージで完結すると述べました。同様に、このプラットフォームは、ビジョン AI モデルのライフサイクル全体を管理するための統合されたワークスペースを開発者に提供します。
デモでは、データセットの準備を迅速化するAI支援アノテーションツール、専門家と初心者の両方に対応するカスタマイズ可能なトレーニングオプション、およびトレーニング実行のリアルタイム監視が紹介されました。
YV25のもう1つのハイライトは、Oisin Lunnyが司会を務めたエッジデプロイメントに関するパネルでした。このセッションでは、ソニーセミコンダクターソリューションズの辻雄基氏、ラズベリーパイのDavid Plowman氏、Glenn Jocher氏が講演しました。
ディスカッションでは、AIをエッジに移行することで、レイテンシが短縮され、コストが削減され、プライバシーが向上する方法が検討されました。Yuki氏は、チップ上で直接推論を実行できるソニーのIMX500センサーを紹介しました。一方、David氏は、Raspberry Piがメーカーのルーツから大規模な商用アプリケーションに拡大していることについて語りました。

また、パネルディスカッションでは、開発者にとって最大のハードルの1つである、異なるデバイス間でモデルをスムーズに実行させることについても触れられました。ここで、Ultralytics Pythonパッケージが重要な役割を果たします。
幅広いエクスポートオプションにより、トレーニング済みのモデルをモバイル、組み込みシステム、またはエンタープライズハードウェアに簡単に移行できます。Ultralyticsは、モデル変換の苦労を取り除くことで、チームが互換性の問題に取り組むのではなく、ソリューションの構築に集中できるように支援します。
Davidが説明したように、「モデルの変換はひどいものであり、他の誰かがそれをやってくれるなら、はるかに楽になるという苦い経験から私は知っています。Ultralyticsはまさにストーリーを改善し、ユーザーにとって価値のあるものを提供しているのです。」
AIソフトウェアの進歩はハードウェアと並行して進んでおり、両者が一体となってコンピュータビジョンの新たなイノベーションの波を推進しています。Ultralytics YOLOのようなモデルは精度を向上させ続けていますが、その現実世界での影響は、それらが実行されるプラットフォームにも左右されます。
例えば、Seeed Studioは、Ultralytics YOLOモデルがプリロードされたreCameraやXIAOボードのようなモジュール式の低コストハードウェアが、開発者がプロトタイピングから現実世界のAIシステムに移行するのをいかに容易にするかを紹介しました。この種のハードウェアとソフトウェアの統合により、参入障壁が下がり、ハードウェアレベルでのイノベーションが採用を直接加速する方法を示しています。
ハードウェアとソフトウェアの連携設計がどのように新たな可能性を切り開いているかを強調した、他のYV25基調講演からの重要なポイントを以下に示します。
ソフトウェアとハードウェアの両方の進歩が連携して進むことで、コンピュータビジョンはかつてないほどの速さで進化しています。これらの並行した開発は、精度と速度を向上させるだけでなく、ビジョンAIが現実世界でどのように展開できるかを形作っています。YV25では、参加者はロボティクス、エッジ展開、マルチモーダルAIの専門家から話を聞く機会があり、それぞれがこの分野の今後の方向性について異なる視点を提供していました。
例えば、彼の基調講演で、D-RoboticsのMichael Hart氏は、Ultralytics YOLOモデルと彼らのコンパクトなRDK X5ボード(小型の組み込みAIビジョンモジュール)を組み合わせることで、ロボットが高度なビジョンモデルをリアルタイムで実行できるようになることを実証しました。彼のライブデモは、ロボット工学が実験室での実験から実用的なAI搭載システムへと、いかに進化したかを示しました。

同様に、Axelera AIのAlexis CrowellとSteven Hunscheは、エッジでのVision AIの展開における課題と機会を強調しました。ライブデモを通じて、Axelera AIのMetis AI Processing Units(AIPU)がRISC-Vとデジタルインメモリコンピューティングを組み合わせて、非常に低い電力で高性能を実現する方法を説明しました。M.2やPCIeなどの使い慣れたフォームファクターにパッケージ化されたこのプラットフォームのハードウェアとソフトウェアの協調設計により、エッジAIのスケーリングが実用的かつ効率的になります。
また別のセッションでは、Hugging FaceのMerve Noyan氏が、ビジョンとテキスト、オーディオ、その他の入力を組み合わせたマルチモーダルAIの台頭について解説しました。彼女は、ドキュメント分析からエンボディドエージェントまで、幅広いユースケースについて語り、オープンソースのイノベーションがAIの導入を加速させていることを強調しました。
YV25は刺激的な全体像に関する講演を特集しましたが、非常に実践的なセッションも含まれていました。Lightning AIのJiri Borovecは、PyTorch LightningとマルチGPUサポートを使用してUltralytics YOLOモデルをトレーニングおよびファインチューニングする方法を示す実践的なウォークスルーを行いました。
彼はコード例を説明し、オープンソースツール、明確なドキュメント、柔軟なフレームワークによって、開発者がトレーニングを拡張し、すべての段階を検証し、ワークフローを自分のプロジェクトに適応させることがいかに容易になるかを強調しました。これは、コンピュータビジョンの真の進歩にとって、コミュニティとアクセス可能なツールがいかに重要であるかを再認識させるものでした。
スペクトルの反対側では、講演者は聴衆にAIの社会におけるより広範な役割について考えるよう促しました。基調講演で、未来学者、人道主義者、およびThe Futures AgencyのCEOであるGerd Leonhardは、「テクノロジーは、私たちがそれを使用するまで道徳的に中立である」と主張し、真の問題はAIが何ができるかだけでなく、何をすべきかであると強調しました。彼は、還元主義や虚偽などの罠に陥ることを警告し、人類の長期的な利益に真に役立つAIを求めました。

プライバシーとセキュリティを重視するオックスフォード大学のCarissa Véliz氏との炉辺談話でも、責任に対する焦点は継続されました。彼女は、オープンソースコミュニティがコードのチェックと改善に不可欠であり、倫理と設計は切り離せないものであると指摘しました。彼女のメッセージは明確でした。開発者は、誤用を予測し、人間の尊厳と社会の幸福を第一に考えるシステムを構築する必要があるのです。
YV25は、講演やデモを超えて、人々がつながる場も提供しました。コーヒーブレイクやランチの時間には、参加者が交流し、経験を共有し、アプローチを比較し、新たなコラボレーションを生み出しました。
Ultralyticsチームにとっても、直接会って交流できる素晴らしい機会となりました。メンバーが世界中に散らばっているため、このような時間はつながりを強化し、共に進捗を祝うのに役立ちます。

その日はアフターパーティーで締めくくられ、参加者はリラックスしてネットワーキングを続ける機会を得ました。それは、振り返り、充電し、Vision AIの次のイノベーションの章を見据える瞬間でした。
YOLO Vision 2025は、アイデア、イノベーション、そしてコミュニティを祝うイベントでした。Ultralytics YOLOv26の発表が幕を開け、その後、エッジ展開や人間中心のAIに関する魅力的な講演が行われ、Vision AIの急速な進歩と、世界への影響力の拡大が強調されました。
基調講演に加えて、このイベントは人々を結びつけました。研究者、開発者、愛好家が経験を共有し、有意義な会話を spark し、将来の新しい可能性を探求しました。イベントは、参加者がUltralytics YOLOモデルとコンピュータビジョンの将来に興奮して、最高の形で終了しました。
AIについてもっと知りたいですか?コミュニティやGitHubリポジトリに参加して、AIとコンピュータビジョンについてさらに学びましょう。ソリューションページでは、農業におけるコンピュータビジョンやロボット工学におけるAIの応用例をご覧いただけます。ライセンスオプションを確認して、今日からコンピュータビジョンを始めましょう。