CVPR 2025におけるウルトラリティクスの主なハイライト

アビラミ・ヴィナ

3分で読める

2025年6月18日

CVPR2025でのUltralyticsの経験を、ブースのハイライトから実際のコンピュータビジョンの使用例、ナッシュビルでの印象的な瞬間まで、振り返ります。

先週6月11日から15日まで、Ultralyticsチームはテネシー州ナッシュビルで開催されたCVPR 2025 - IEEE/CVF Conference on Computer Vision and Pattern Recognitionに参加してきました。これはコンピュータビジョンとAI研究の分野で毎年開催される重要なイベントのひとつです。 

ミュージック・シティ・センターで開催された今年のカンファレンスには、世界中から12,000人を超える参加者が集まった。学術研究者やエンジニアから業界リーダーや開発者まで、Vision AIの限界に挑む人々で賑わった。 

特にCVPR2025では、コンピュータビジョンやマルチモーダル学習におけるディープラーニングから、生成AIモデル、基礎モデル、そして自律走行や3Dシーン理解のような実世界での応用に至るまで、最先端の研究や会話が紹介された。

図1.テネシー州ナッシュビルで開催されたCVPR2025。

Ultralyticsにとって、CVPR 2025での一週間は、コンピュータビジョンコミュニティとのつながり、デモの共有、そしてUltralyticsのYOLOモデルがどのように業界全体で使用されているかを学ぶことに集中しました。ブース1512では、最新のビジョンAIソリューションを展示し、何百人もの来場者と実用的な使用例について話し、私たちの仕事がロボット工学、小売、研究などの分野でどのようにイノベーションを後押ししているかを直接目にすることができました。 

そこで、このイベントでの主な収穫、会話、コミュニティとのつながりを中心に、私たちが気に入った瞬間をいくつかご紹介しよう。 

CVPRナッシュビル2025の展望

CVPRは1983年に初めて導入され、1985年にIEEEによって正式に後援されました。長年にわたり、世界中の研究者、技術者、革新者を集め、コンピュータビジョンとパターン認識の分野で最も影響力のある会議の1つに成長してきました。2012年からは、コンピュータビジョン研究へのオープンアクセスを支援する非営利団体であるコンピュータビジョン財団(CVF)が共催し、イベントの開催に重要な役割を果たしています。 

毎年開催されるCVPRは、その技術的な奥深さで知られるようになり、物体認識の初期のブレークスルーから、今日のVision AIやディープラーニングの進歩に至るまで、この分野全体の方向性を形作る一助となっている。今年の論文投稿数は13,000件を超え、昨年より13%増加した。採択率はわずか22%で、インパクトのある研究にスポットライトを当てるというこの会議の伝統を引き継いだ。

CVPR2025で目立った主な研究テーマを簡単に紹介しよう:

  • 3Dシーン理解とニューラル・レンダリング:研究者たちは、ロボット工学、拡張現実、シミュレーショ ンなどのアプリケーションを進歩させるために、複数のビューやセ ンサー入力を使って世界を3次元で再構成し、表現する方法を探っ ている。
  • ジェネレーティブAIを用いた画像・映像合成 生成的AI: この分野では、テキストプロンプトやスケッチのような最小限の入力から高品質のビジュアルを作成することに焦点を当て、クリエイティブメディアやインタラクティブシステムのための次世代ツールを強化する。
  • マルチモーダル学習と視覚言語モデル: これらのモデルは、視覚データと言語データを組み合わせることで、理解、推論、コミュニケーションを向上させ、より一般的で適応性の高いAIシステムへの道を開く。

CVPRのためにミュージック・シティ・センターで設営

カンファレンスが正式にスタートする前に、私たちのチームはナッシュビルに到着し、CVPR2025に向けてすべての準備を整えた。 

私たちはミュージック・シティ・センターの1512番ブースを拠点に、デモ、会話、コミュニティ形成の3日間を過ごした。機材を持って、私たちはハードウェアの梱包を解き、YOLOのライブデモを設定し、テンポの速いエキスポ環境ですべてがスムーズに進むように慎重にセットアップを整えた。 

スペースは、機材を降ろし、デモをテストし、ブースを組み立てる人々で徐々に埋まっていった。その様子を見ていると、CVPRがいかにグローバルで協力的な組織であるかを思い知らされる。

生産的な午後を過ごした後、チームはシフトチェンジしてナッシュビルのダウンタウンを散策した。当然のことながら、彼らはブロードウェイに立ち寄った。ブロードウェイでは、どのバーやレストランからもカントリーミュージックの生演奏が聞こえてくる。 

チームの何人かはカウボーイ・ブーツを手にし(何人かは初めての経験)、地元の定番人気店「Hattie B's」のホットチキンで夜を締めくくった。仕事と楽しみの完璧なミックスだった。ブースの準備も整い、チームはCVPR2025が何を用意しているのか見るために充電された。

コンピュータ・ビジョンとAI研究についての会話

エキスポの初日は、Ultralyticsチームが現地に到着し、準備を整えるところから始まりました。デジタルコンテンツマネージャーのヌヴォラ・ラディ、イベントマネージャーのジニア・プルダッド、機械学習エンジニアのフランチェスコ・マッティオリは、午前9時までにミュージックシティセンターに到着しました。

午前10時ごろになると観客が押し寄せ始め、エキスポ会場の活気は一気に高まった。私たちのブースはすぐに来場者でいっぱいになり、ウルトラリティクスのグッズ、特にトートバッグとステッカーは数分でなくなりました。楽しいアイスブレイクのおかげで会話が弾み、人が集まってきた。

図2.ヌヴォラ・ラディジニア・プルダッドフランチェスコ・マッティオリ(ブース1512にて)。

一日を通して、さまざまなプロジェクトに取り組んでいる研究者、エンジニア、開発者と話す機会があった。YOLOのライブ・デモには多くの関心が寄せられ、ロボット工学、ヘルスケア、製造、小売など、さまざまな分野での使用例を聞くことができた。私たちのモデルが、初期の学術研究からエンタープライズ・システムの導入まで、いかに幅広く利用されているかを目の当たりにし、刺激を受けました。

また、インテルOpenVINOやソニーセミコンダクターソリューションズのチームなど、AI分野の協力者とも再会することができました。他のイノベーターとフロアを共有することで、Vision AIの分野がいかに協力的で動きの速いものであるかを再確認することができました。

一日の終わりに、チームはPrinters Alleyに向かい、カントリーミュージックの生演奏を楽しみながらくつろいだ。フロアでの会話と素晴らしいエネルギーに溢れた一日を終え、CVPR2025の初日を締めくくるには最高の場所となった。

図3.チームはプリンターズ・アレイを探検する機会を得た。

ナッシュビルで開催されたコンピューター・ビジョン・カンファレンス2日目

CVPR2025の2日目は、初日の続きから始まりました。ブース1512は終日活気に溢れ、UltralyticsのYOLOモデルについて学んだり、自分の仕事をシェアしたりするために、リピーターや新しい参加者が立ち寄りました。

例えば、この日最も印象的だったのは、インテル・ロボドッグが来場したときのことだ。先進的なハードウェアと実用的なビジョンモデルが組み合わされ、実際に動いているのを目の当たりにし、イベントの精神を強く感じた。

図4.インテル・ロボドッグがブース1512に来訪。

夕方、私たちのチームはインテル主催のAfter.CVPR() Developer Meetupに参加した。AIエコシステム全体のエンジニア、研究者、開発者たちが集う、リラックスしたコラボレーションの場でした。 

ミートアップでは、ライブデモと有意義な会話が夜遅くまで続きました。イベント中、Francesco Mattioli氏は、UltralyticsとOpenVINOをフィーチャーした共同デモを発表し、我々のモデルがどのように効率的な推論パイプラインに統合できるかを紹介しました。 

彼は、Ultralytics YOLO11のようなモデルをOpenVINOフォーマットにエクスポートし、インテルハードウェア上でより高速で最適化された推論を実現する方法を説明した。デモでは、中央処理装置(CPU)、グラフィック処理装置(GPU)、ニューラル処理装置(NPU)のサポートが強調された。このデモは、エッジAIやリアルタイム・アプリケーションに取り組むチームから大きな関心を集めた。

図5.After.CVPR()開発者ミーティングの様子。

CVPRでのコンピュータビジョン応用におけるディープラーニング

CVPR2025の最終日も、ミュージック・シティ・センターは活気に満ちていた。参加者はブースを巡り、思慮深い会話を交わし、会議での時間を最大限に活用していた。

この日のハイライトのひとつは、CVPRでの研究発表の中核をなすポスター・セッションをチェックすることだった。伝統的なステージ・プレゼンテーションとは異なり、ポスター・セッションはよりインフォーマルでインタラクティブだ。 

各研究者は、自分の研究を要約したポスターを大きく印刷したものを設置し、その近くに立って説明したり、質問に答えたり、立ち寄った人と研究結果について話し合ったりする。短時間で幅広いトピックについて学ぶことができ、参加者と発表者の間で実際に会話する場が生まれる。

視覚言語モデルや3Dシーン理解から、ロボット工学やヘルスケアにおけるAIの実世界での応用までを網羅する、多種多様なポスターを見ることができた。セッションは、この分野で探求されている最新のアイデアを間近で見ることができ、また、その背後にいる人々と直接つながる機会を与えてくれた。

イベントが終了し、私たちはこれまで以上にやる気を感じています。この1週間は、学習、コラボレーション、そしてVision AIにおける真の勢いに満ちていた。

要点

CVPR2025は、学び、共有し、つながる素晴らしい一週間でした。最先端の研究から実践的なデモ、素晴らしい会話まで、このカンファレンスはVision AIの急速な発展と、それを支えるコミュニティがいかに影響力があり、協力的であるかを示してくれました。

ウルトラリティクスのYOLOモデルが、多くの実世界や研究用途で活躍しているのを見るのは刺激的でした。CVPR2025は、何よりも、コンピュータビジョンがAIイノベーションの中心にあり、まだまだ多くのことが起こるということを明確にしました。

コミュニティに参加して、GitHubリポジトリでビジョンAIに飛び込みましょう。当社のソリューションページで、小売業におけるAIや 製造業におけるコンピュータビジョンのようなイノベーションについて学んでください。ライセンスプランをチェックして、今すぐAIの旅を始めましょう!

AIの未来
を一緒に作りましょう!

機械学習の未来への旅を始めよう

無料で始める
クリップボードにコピーされたリンク